第201章展博的代码知音（第2页）

乔卫东说，“以前投资过几家AI公司，看过一些。”

展博将信将疑，但还是调出了代码。

乔卫东凑过去看，手指在屏幕上滑动，目光快速扫过一行行代码。

看了大概三分钟，他开口：“问题出在这里。”

“哪里？”

“特征交叉的方式。”

乔卫东指着一段代码，“你们只用了一阶和二阶交叉，对于用户行为这种高维稀疏数据来说，信息损失太大了。”

展博眼睛一亮：“对！

我也想过这个问题！

但高阶交叉计算量太大……”

“可以用Fm（Factorizationmachines）。”

乔卫东说，“或者更好的，deepFm，把深度神经网络和因子分解机结合起来。

既保留了低阶特征交互，又能捕捉高阶非线性关系。”

展博张大了嘴巴：“deepFm……我听说过，但没实际用过……”

“现在用的人不多，但效果不错。”

乔卫东拿过一张纸，开始画示意图，“你看，这里用dNN处理高阶特征，这里用Fm处理低阶特征，最后融合。

这样既能保证效果，又能控制模型复杂度。”

他在纸上写下几个公式和架构图。

展博看得如痴如醉，眼镜后面的眼睛越来越亮。

“还有这里，”

乔卫东又指向另一段代码，“负采样策略可以优化。

你们现在用的是随机负采样，效果不稳定。

可以试试基于流行度的负采样，或者更高级的，对抗式负采样。”

“对抗式？”

展博完全没听过这个词。

“简单说，就是用一个生成器来产生‘难负例’。”

乔卫东又画了个图，“这样模型能学到更有区分度的特征。”

展博彻底服了。

他从硅谷回来，自以为算是技术前沿的人，但乔卫东说的这些，有些他都没听过！

“乔先生，您……您这些是从哪儿学的？”

他结结巴巴地问。

“多看论文，多实践。”

乔卫东轻描淡写，“AI发展很快，每天都有新东西。

不过万变不离其宗，底层逻辑是一样的。”

他喝了口茶，继续说：“另外，我觉得你们的方向可以调整一下。”

“怎么调整？”

“现在大家都在做精排，就是最后那一步的排序模型。”

本章未完，点击下一页继续阅读

第201章 展博的代码知音（第2页）