首页 > 计算机类考试> 计算机二级> 公共基础知识
题目内容 (请给出正确答案)
[主观题]

我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()A.我们

我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()

A.我们随机抽取一些样本,在这些少量样本之上训练

B.我们可以试用在线机器学习算法

C.我们应用PCA算法降维,减少特征数

D.B和C

E.A和B

F.以上所有

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“我们建立一个5000个特征,100万数据的机器学习模型.我们…”相关的问题
第1题
对应GradientBoostingtree算法,以下说法正确的是:()

A.当增加最小样本分裂个数,我们可以抵制过拟合

B.当增加最小样本分裂个数,会导致过拟合

C.当我们减少训练单个学习器的样本个数,我们可以降低variance

D.当我们减少训练单个学习器的样本个数,我们可以降低bias

点击查看答案
第2题
机器学习的主旨是让计算机去模拟或实现人类的学习行为,是人工智能的核心。机器学习虽然可以在大数据训练中学到正确的工作方法,但它也很容易受到恶意干扰。通常攻击者是通过输入恶意数据来“欺骗”机器学习模型,导致其出现严重故障。近日,“Data61”机器学习小组研发出了一种机器学习的新算法。这种新算法通过类似疫苗接种的思路,帮助机器学习“修炼”出抗干扰能力。这是针对机器学习模型打造的防干扰训练,譬如,在图片识别领域,该算法能够对图片集合进行微小的修改或使其失真,激发出机器学习模型的抗干扰能力,并形成相关的自我抗干扰训练模型。这段文字意在说明:()

A.干扰机器识别图像的新方法

B.新算法助机器学习抵抗干扰

C.机器学习是人工智能的核心

D.机器学习大数据训练的方法

点击查看答案
第3题
我们想在大数据集上训练决策树,为了使用较少时间,我们可以()A.增加树的深度B.增加学习率(learnin
我们想在大数据集上训练决策树,为了使用较少时间,我们可以()

A.增加树的深度

B.增加学习率(learnin grate)

C.减少树的深度

D.减少树的数量

点击查看答案
第4题
对于PCA说法正确的是()1.我们必须在使用PCA前规范化数据2.我们应该选择使得模型有最大variance的
对于PCA说法正确的是()

1.我们必须在使用PCA前规范化数据

2.我们应该选择使得模型有最大variance的主成分

3.我们应该选择使得模型有最小variance的主成分

4.我们可以使用PCA在低维度上做数据可视化

A.1,2and4

B.2and4

C.3and4

D.1and3

E.1,3and4

点击查看答案
第5题
在机器学习概念中,有监督学习、无监督学习和强化学习三大类典型方法。下列学习任务属于无监督学习的是()。

A.根据样本数据,采用分类算法,训练分类器

B.根据样本数据,进行回归分析

C.将未知类别的一组数据,采用聚类方法,分成不同的组

D.机器人在报考环境中,自主学习掌握行走方法

点击查看答案
第6题
机器学习算法开发流程包含()

A.数据选择

B.模型训练

C.测试模型

D.调优模型

E.验证模型

F.使用模型

点击查看答案
第7题
以下说法正确的是()1.一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的2.如果增加模
以下说法正确的是()

1.一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的

2.如果增加模型复杂度,那么模型的测试错误率总是会降低

3.如果增加模型复杂度,那么模型的训练错误率总是会降低

4.我们不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习

A.1

B.2

C.3

D.1and3

点击查看答案
第8题
到2000年前后,机器学习开始流行的原因如下:___。

A.高效率的机器学习训练算法

B.神经网络的商业应用

C.机器人棋手战胜了象棋冠军

D.行业数据开始指数级的增长

点击查看答案
第9题
以下选项中,机器学习算法真正用来“学习”的数据是()

A.验证集

B.训练集

C.测试集

D.超参数集

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改