我同事用训练集里的一部分数据做验证集,做算法的朋友你们怎…

我同事用训练集里的一部分数据做验证集,做算法的朋友你们怎么看[哈哈][哈哈]

新浪员工:常规操作

产品汪.盗圣白展堂:不是做算法的,但是感觉很扯

程序猿.武当弟子:你觉得是常规操作?

程序猿.武当弟子:太扯了,他竟然用这个当做验证集判断模型好不好

张三李四张三:没事一上线圆形必漏

程序猿.武当弟子:我感觉我要走了,他是我们的小组长

程序猿.宋兵乙:问题是他有没有把这部分数据用来训练?

程序猿.武当弟子:当然是训练了啊。从训练集里取出来的,既当训练集又当验证集

程序猿.哥斯拉哥哥:曾经见过用训练集做测试的

程序猿.华山弟子:那还训练个鸡儿啊

张三李四张三:看看网络的过拟合能力。如果量够大,完全覆盖线上case,其实也可以。

程序猿.武当弟子:得了吧。我们数据贼少

张三李四张三:那确实秀啊

程序猿.宋兵乙[2]:这样做 模型在验证集上的准确率会将近百分之百吧 算是作弊吧

阿里巴巴员工:有问题吗,只要验证集数据不参与本次训练就行

程序猿.宋兵乙[2]:肯定是参与训练了 楼主才会拿出来说吧

程序猿.卖女孩的小福报:哈哈哈哈笑死我了

树猴:特别好,上线见

秦娟:样本可以先分好训练集和测试集

滴滴出行员工:牛皮

携程员工:训练集少的时候,可以做交叉验证的呀,我感觉没毛病啊

测试.荀攸:上线后,不及预期,一塌糊涂

小丸子QAQ:有问题吗?训练集可以选取几比几来做验证的啊

宝宝树(北京)信息技术有限公司员工:我们都是先上线然后近期数据拿来做评价…稳当当

北京搜狐新媒体信息技术有限公司员工:那不是百分之百好?上线试试。直接打脸

这是一个花名:非算法程序员认为会导致过拟合

陆乘风:其实没毛病,大部分只看到了可能有问题;其实,真正做数据的人,还需要解决另一个重要问题,如何证明验证集起到验证的作用;这个领域论文算法非常多,阅读理解应用即可。傻喷不可取。

洗涤灵魂:如果数据量大,用的是模型简单比如就一个逻辑回归,没有过拟合,是可以的

程序猿.慕容复杨:不要告诉他

程序猿.祝融夫人:上线火葬场?

京东商城员工:不一定吧

常凯申:我见过标签转换了一下,当特征去训练的[哈哈]

殷梨亭:评论的人,kfold交叉验证都没见过?

程序猿.武当弟子:作为一个刚跳槽来的,我感觉跳坑里来了。用100挑数据去训练100步,每20步从100条里抽30条数据去验证,我学的交叉验证不是这样做的啊。

程序猿.武当弟子:而且领导也不理解,自己随意上线。我提了个方案,本来我们数据集少,用数据增强后的数据去验证,也比现在的方案好啊

程序猿.武当弟子:交叉验证也不是这样交叉啊,兄弟

程序猿.武当弟子:肯定会越来越高啊

程序猿.武当弟子:主要他工作经验多,核心算法都在他那,我们都不知道他做了啥

北京高科数聚技术有限公司员工:过拟合

程序猿.武当弟子:对啊,肯定过拟合

程序猿.武当弟子:交叉验证不是这样啊

程序猿.武当弟子:各位兄弟们,觉得我是不是应该明年抓紧辞职啊,在这带着就废了呀

程序猿.哥斯拉哥哥:曾经见过用训练集做测试的

张三李四张三:看看网络的过拟合能力。如果量够大,完全覆盖线上case,其实也可以。

阿里巴巴员工:有问题吗,只要验证集数据不参与本次训练就行

树猴:特别好,上线见