网页设计信息搜索框 第1篇
也是一样的道理,根据用户输入的上一句,对出下一句。
2. Query改写
关键词(Query)改写是通过分析原始关键词,生成一系列与原始关键词相关的信息,作为补充,与原始关键词一起参与搜索,从而得到更加准确的搜索结果。
自然语言中存在大量的一词多义现象,比如<苹果>,用户想要的可能是水果也可能是手机等电子产品;比如<西红柿>和<番茄>,同一物体有不同的表达方式;又比如搜索<酒店>,实际的需求并不是了解酒店信息而是预订酒店客房。这些场景语义不确定的场景均可以通过关键词改写的方式来解决。
关键词改写的常用方法主要有:
网页设计信息搜索框 第2篇
在实际项目中,单方面追求精准率或召回率都是不正确的,理想情况是做到两者都高。
但鱼和熊掌不可兼得,精准率高了召回率就会低,召回率高了精准率就会低。如果是做搜索,应该优先保证召回率的前提下提升精准率。
3. F值
通过上面的公式,可以看到召回率和精准率的分子是相同的,但分母不同。因此对于同一策略模型,同一阈值,可以统计出一组确定的精准率和召回率。
遍历0-1之间的所有阈值,就可以画出每个阈值下的关系点,从而得到一条曲线,称之为P-R曲线。
得到了曲线,我们当然希望可以找得到一个精准率和召回率都很高的情况,但实际上很难做到,最好是可以找到二者之间的平衡点。
这时候就需要用到F1分数,为F分数的特殊情况。F1分数的本质是当召回率与精准率权重相同时,寻找二者能达到的最佳平衡。
但往往我们对召回和精准率的权重要求是不同的,因此也往往使用F2或来评价策略,两者分别表示更重视召回率和准确率。
4. ROC、AUC
前文介绍了F值,但大家可以发现它仅能评估单点的效果而无法表示策略的整体效果。这里介绍的ROC/AUC是一套成熟的整体策略评估方法。
网页设计信息搜索框 第3篇
用户输入
这些猜测汇聚为候补集,通过噪声模型推分数最高的关键词。