我同事用训练集里的一部分数据做验证集,做算法的朋友你们怎么看[哈哈][哈哈]
新浪员工:常规操作
产品汪.盗圣白展堂:不是做算法的,但是感觉很扯
程序猿.武当弟子:你觉得是常规操作?
程序猿.武当弟子:太扯了,他竟然用这个当做验证集判断模型好不好
张三李四张三:没事一上线圆形必漏
程序猿.武当弟子:我感觉我要走了,他是我们的小组长
程序猿.宋兵乙:问题是他有没有把这部分数据用来训练?
程序猿.武当弟子:当然是训练了啊。从训练集里取出来的,既当训练集又当验证集
程序猿.哥斯拉哥哥:曾经见过用训练集做测试的
程序猿.华山弟子:那还训练个鸡儿啊
张三李四张三:看看网络的过拟合能力。如果量够大,完全覆盖线上case,其实也可以。
程序猿.武当弟子:得了吧。我们数据贼少
张三李四张三:那确实秀啊
程序猿.宋兵乙[2]:这样做 模型在验证集上的准确率会将近百分之百吧 算是作弊吧
阿里巴巴员工:有问题吗,只要验证集数据不参与本次训练就行
程序猿.宋兵乙[2]:肯定是参与训练了 楼主才会拿出来说吧
程序猿.卖女孩的小福报:哈哈哈哈笑死我了
树猴:特别好,上线见
秦娟:样本可以先分好训练集和测试集
滴滴出行员工:牛皮
携程员工:训练集少的时候,可以做交叉验证的呀,我感觉没毛病啊
测试.荀攸:上线后,不及预期,一塌糊涂
小丸子QAQ:有问题吗?训练集可以选取几比几来做验证的啊
宝宝树(北京)信息技术有限公司员工:我们都是先上线然后近期数据拿来做评价…稳当当
北京搜狐新媒体信息技术有限公司员工:那不是百分之百好?上线试试。直接打脸
这是一个花名:非算法程序员认为会导致过拟合
陆乘风:其实没毛病,大部分只看到了可能有问题;其实,真正做数据的人,还需要解决另一个重要问题,如何证明验证集起到验证的作用;这个领域论文算法非常多,阅读理解应用即可。傻喷不可取。
洗涤灵魂:如果数据量大,用的是模型简单比如就一个逻辑回归,没有过拟合,是可以的
程序猿.慕容复杨:不要告诉他
程序猿.祝融夫人:上线火葬场?
京东商城员工:不一定吧
常凯申:我见过标签转换了一下,当特征去训练的[哈哈]
殷梨亭:评论的人,kfold交叉验证都没见过?
程序猿.武当弟子:作为一个刚跳槽来的,我感觉跳坑里来了。用100挑数据去训练100步,每20步从100条里抽30条数据去验证,我学的交叉验证不是这样做的啊。
程序猿.武当弟子:而且领导也不理解,自己随意上线。我提了个方案,本来我们数据集少,用数据增强后的数据去验证,也比现在的方案好啊
程序猿.武当弟子:交叉验证也不是这样交叉啊,兄弟
程序猿.武当弟子:肯定会越来越高啊
程序猿.武当弟子:主要他工作经验多,核心算法都在他那,我们都不知道他做了啥
北京高科数聚技术有限公司员工:过拟合
程序猿.武当弟子:对啊,肯定过拟合
程序猿.武当弟子:交叉验证不是这样啊
程序猿.武当弟子:各位兄弟们,觉得我是不是应该明年抓紧辞职啊,在这带着就废了呀
程序猿.哥斯拉哥哥:曾经见过用训练集做测试的
张三李四张三:看看网络的过拟合能力。如果量够大,完全覆盖线上case,其实也可以。
阿里巴巴员工:有问题吗,只要验证集数据不参与本次训练就行
树猴:特别好,上线见