第201章 展博的代码知音(第2页)
乔卫东说,“以前投资过几家AI公司,看过一些。”
展博将信将疑,但还是调出了代码。
乔卫东凑过去看,手指在屏幕上滑动,目光快速扫过一行行代码。
看了大概三分钟,他开口:“问题出在这里。”
“哪里?”
“特征交叉的方式。”
乔卫东指着一段代码,“你们只用了一阶和二阶交叉,对于用户行为这种高维稀疏数据来说,信息损失太大了。”
展博眼睛一亮:“对!
我也想过这个问题!
但高阶交叉计算量太大……”
“可以用Fm(Factorizationmachines)。”
乔卫东说,“或者更好的,deepFm,把深度神经网络和因子分解机结合起来。
既保留了低阶特征交互,又能捕捉高阶非线性关系。”
展博张大了嘴巴:“deepFm……我听说过,但没实际用过……”
“现在用的人不多,但效果不错。”
乔卫东拿过一张纸,开始画示意图,“你看,这里用dNN处理高阶特征,这里用Fm处理低阶特征,最后融合。
这样既能保证效果,又能控制模型复杂度。”
他在纸上写下几个公式和架构图。
展博看得如痴如醉,眼镜后面的眼睛越来越亮。
“还有这里,”
乔卫东又指向另一段代码,“负采样策略可以优化。
你们现在用的是随机负采样,效果不稳定。
可以试试基于流行度的负采样,或者更高级的,对抗式负采样。”
“对抗式?”
展博完全没听过这个词。
“简单说,就是用一个生成器来产生‘难负例’。”
乔卫东又画了个图,“这样模型能学到更有区分度的特征。”
展博彻底服了。
他从硅谷回来,自以为算是技术前沿的人,但乔卫东说的这些,有些他都没听过!
“乔先生,您……您这些是从哪儿学的?”
他结结巴巴地问。
“多看论文,多实践。”
乔卫东轻描淡写,“AI发展很快,每天都有新东西。
不过万变不离其宗,底层逻辑是一样的。”
他喝了口茶,继续说:“另外,我觉得你们的方向可以调整一下。”
“怎么调整?”
“现在大家都在做精排,就是最后那一步的排序模型。”
本章未完,点击下一页继续阅读