结果是一个静态的通用算法,该到进一步发展。这个算法对于每种情况都是相同的。如果出现全新的、前所未见的情况,算法最初就会不堪重负。该算法还必须考虑用户所处的每个单独环境,例如位置、使用的设备等。理想情况下,每个用户或至少每个用户组都“应该”拥和更大的有自己的个性化算法,以便根据各自的情况提供服务。对于当前相对静和更大的态的算法来说这是不可能的。
不可能为每个任务编写单独的算法。必须编写从观 手机号码数据 察中学习的算法。机器学习将使这成为可能,谷歌已经朝着这个方向努力。
此外,Google 还拥有来和更大的 用户的信号,可作为学习过程中的成功指标:
- 长点击与短点击比率
- 执行相关搜索和附加搜索的搜索者百分比
- 用户参与度的关键数据(例如可通过 Chrome 确定)
- SERP中的相对踢出率
- 共享内容
- 网站用户参与度
结合经典的页外排名信号(例如 因为它们似乎可以一次性解 反向链接、共同引用和共同出现),这些可以作为成功指标来验证算法的评估。
一个有趣的问题是,谷歌从哪里获取与用户相关的训练数据来启动机器学习过程?
这是真实的用户数据吗?还是谷歌会继续使用搜索和更大的评估器收集的数据?质量评估者是在测试环境中生成的吗?
(我们欢迎在评论中讨论这个话题。)
上述算法开发模型正在逐和更大的渐变得过时。证据还在于实时更新的频率不断增加,例如实时的企鹅更新或“与熊猫并肩而行”的更新。过去,即将发布的更新会大声宣布,并由sistrix 等同事记录下来。我认为这样的纪录片很快就会失去意义。我们所知的排名因素的研究和概述将在几年后成为历史。下文将对此进行详细介绍。
Google 已经在索引和排名中包含了来自不同级别的大量信息,这些信息必须以某种方式被算法考虑在内
- 文本
- 视觉效果(图片、视频)
- 声音的
- 用户行为
- 知识图谱(关系图像)
谷歌现在还可以从图像中读取数 德斯刀片工廠 字和文本,正如我的同事 Philipp 下周将在他的文章中令人印象深刻地描述的那样。
更多内容请阅读文章《图像识别:谷歌可以读取和识别图像中的文本吗?》
如果你再次审视不同类型的机器学习并将它们转移到搜索引擎世界,那么考虑至少机器学习方法已经在谷歌得到使用是有意义和更大的的。在搜索方面,人们至少可以在这里识别出机器学习的方法:
- 知识图谱
- 蜂鸟
- Rankbrain
- 可能是实时企鹅
此外,目前已经有一些谷歌产品使用了深度学习功能,比如图像识别中的文本、语音识别、谷歌翻译……