第32章 搜索技术(1 / 2)

“等等”

乔海伦拦住了滔滔不绝的杨思源,皱着眉头问,“你是说,你自己发明了一种新的搜索引擎算法”

“不是啊,”杨思源否定道,“不是一种,是好几种。”

乔海伦感觉头大,有种马上要爆炸开的感觉。

杨思源继续解释,“现在流行的搜索引擎算法,有点落后了,已经渐渐跟不上时代,满足不了实际应用的需求了。

比如原来的点歌机里用的搜索算法,本质上可以理解为在提前对信息库中的信息做好分类目录的前提下,匹配相关名称或代码。

形象一点说,就好比图书馆里找一本书,你得知道书名或者图书馆给这本书的具体编号,才能知道这本书在哪能找到。

如果找书的人信息不全,只能去大分类的图书区自己找,非常没有效率。

而未来搜索算法的趋势呢,是通过信息片段就可以精确定位,方便用户快速得到想要查找的信息。

通过一点信息片段,去匹配数据库或整个网络中所有信息,根据匹配度和信息热度提供给用户。”

杨思源只能解释到这个阶段了,像布尔模型、概率模型或者向量空间模型这些搜索模型他直接不提。

别说石磊了,乔海伦这种专业学计算机技术的,也不一定能听懂。

因为计算机技术也包含太广泛的领域了,大学教育里教授的计算机知识,也仅限于一些基础知识和某一领域的内容。

只有进步一深造或者在工作中在某个领域进行研究,才能明白这个领域的技术内涵。

更不用说这些搜索模型涉及的还有很多高深的数学知识了。

石磊和乔海伦果然一脸懵逼。

杨思源还是操作起来,用眼前的例子来具体说明。

“石经理你喜欢刘德华吧,那么咱就那刘天王为例,他上一张专辑里有首闽南风的歌叫世界第一等。

假设一个歌迷,他听了这首歌的旋律,觉得喜欢,到歌厅的时候要点歌了,却不知道歌名。

这首歌又是闽南语歌,歌词他也听了个大概,如果是原来的点歌机,把这首歌找出来是有点麻烦的。

但新的点歌系统可以轻松做到。”

杨思源说着在搜索栏输入“世界第一”,搜索结果很快出来,有两个结果:

世界第一等刘德华

世界第一等伍佰

“因为歌名里含世界第一的本来也不多,这首歌很容易能搜到。

换原来的方式,歌迷搜不出来,只能在刘德华的歌曲里一首一首的人工找,要耗费时间和精力,用户体验就不好了。”

“是方便了很多啊,这样一来,用户可以仅凭某个歌名中的关键词,就能轻松找到自己想唱的歌了。”

杨思源笑了,“不仅如此。你们再看。”

他从新输入,这次是输入了这首歌的一句歌词“人生的环境”,搜索结果还是一样的。

“这是通过一句歌词就把歌给找出来了”

“对。这就是搜索算法的进步,首先肯定是匹配歌名,歌名匹配不上,它会自动从字幕文件里搜索,去匹配最接近的歌词。

然后根据歌词指向的歌名,显示出结果来。”

石磊想了一下,“那搜只搜人生二字呢”

杨思源道,“那结果肯定很多,因为很多歌的名字和歌词里都有,按照它的算法,它会根据这首歌的热度来进行默认排名。”

“厉害”

石磊服了,虽然他还理解不了杨思源说的搜索算法到底会有什么样的价值。

乔海伦已经慢慢从极度的惊讶中缓过劲来,意识到杨思源今天来找他,绝对不仅仅是为了向她推荐一款点歌软件那么简单了。

“石经理,你再出去一下,我有话跟小杨说。”

这次直接连借口都不找了,石经理也意识到乔海伦说的非常认真,没多问,直接走出门去,还从外边关好了门。

“坐。”

乔海伦突然变得客气起来。

杨思源知道她要“谈生意”了,果然和聪明人交流,事情会变得简单。

乔海伦已经开始思考这款搜索软件所包含的价值,她还亲自给杨思源倒了一杯水。

“来,喝水。”

杨思源接过来,“小乔老板”

“不是说了让你喊我姐吗”

“哦,海伦姐。”

乔海伦笑了起来,“小杨啊,你今天来,不单是要向我推荐这款点歌软件的吧有什么想法,说来听听。”