我眼中的人工智能人工智能的五个应用2024年6月7日

Mark wiens

发布时间:2024-06-07

  张宁进一步暗示,知乎AI搜刮的第一个版本在春节前一周就曾经上线,前面颠末一个多月的灰度测试,“我们收到的团体反应是,答复质量要高于预期”

我眼中的人工智能人工智能的五个应用2024年6月7日

  张宁进一步暗示,知乎AI搜刮的第一个版本在春节前一周就曾经上线,前面颠末一个多月的灰度测试,“我们收到的团体反应是,答复质量要高于预期”。

  而此次“AI搜刮”功用上线,算是知乎在大模子手艺使用上的一个阶段性功效野生智能的五个使用。张宁报告21世纪经济报导,知乎针对AIGC的规划,在ToC产物上集聚焦于“AI搜刮”我眼中的野生智能。

  在大模子锻炼过程当中,锻炼意料质量将间接影响大模子输出内容质量。各个厂商为了提拔模子质量,常常会投入大批资本对数据停止标注。但张宁向记者暗示,知乎在数据标注上的投入,远低于其他厂商。

  不外,根据大模子的开展速率,知乎储蓄的中文语料数据将来或也将左支右绌。本年年头,周源在承受记者采访时也曾提到中文语料欠缺的成绩。他说,中文优良数据的稀缺,招致海内很多处置大模子开辟的研讨机构和企业在停止模子锻炼时,不能不依靠于外文标注数据集、开源数据集,或是爬取收集数据。

  以是在内容显现上,知乎有别于其他模子,会在答复内容中标注内容滥觞,如许既提拔了内容的可溯源性,加大了对创作者的暴光,同时也大大加强了用户对内容的信赖度

  记者理解到,知乎的AI搜刮功用是以AI创业公司面壁智能的大模子产物为根底。面壁智能建立于2022年8月,开创成员局部来自清华大学NLP尝试室。2023年3月,知乎作为领投方到场了面壁智能的天使轮融资,同年4月,知乎结合面壁智能公布了“知海图AI”中文大模子。

  在张宁看来,这个成果也印证了知乎中文语料的优良我眼中的野生智能。“说假话,这么短的工夫内我们不太能够做出格大范围的数据标注,但获得如许的成果,阐明我们的数据根柢好我眼中的野生智能。已往各人不断说知乎的内容质量高,此次也经由过程AI锻炼的方法停止了考证”。

  周源此前曾向21世纪经济报导记者暗示,在AI时期,消费力的三要素别离是使用处景、专无数据和根底模子。此中,知乎在使用处景和专无数据方面,占有共同劣势。而在根底模子方面,投资面壁智能并与其停止模子共建,是知乎构建根底模子层才能时,挑选的一条捷径我眼中的野生智能。

  今朝,市情上做AI搜刮的公司曾经很多,对知乎而言,其具有的一大劣势就是高质量的中文语料。公然数据显现,停止2022年末野生智能的五个使用,知乎累计具有6310万名内容创作者,他们奉献了约5.06亿条问答内容,笼盖超越1000个垂直范畴。

  “由于AI搜刮跟知乎用户的心智是高度对齐的,用户期望在知乎处理成绩,期望得到专业可托任的优良解答,而恰是AI搜刮所供给的才能”。张宁说。

  记者测试发明,在知乎AI搜刮中发问“怎样利用大模子”,除其他言语大模子都有的笔墨答复外野生智能的五个使用,知乎AI搜刮还在成果上面列入了内容滥觞我眼中的野生智能,好比记者测试的成绩谜底,就有6位答主到场了奉献,而且能够经由过程点击间接跳转至这些答复页面。

  知乎COO、初级副总裁、社区营业卖力人张宁在承受21世纪经济报导记者采访时暗示,知乎的AI产物必然是成立在社区生态上面的。“我们不断在考虑的是,AI搜刮搜出的成果我眼中的野生智能,怎样再反哺给创作者,让创作者觉得到内容是被更多人看到的”。

  以是接下来,知乎也会在AI搜刮方面投入更多精神,包罗在特定的专业范畴长进行更多的数据标注,以进步天生内容的可托度。

  开创人、董事长兼CEO周源引见,知乎的AI搜刮集搜刮、及时问答和诘问功用于一体,并且与其他大模子供给的内容差别,知乎AI搜刮的内容均来自社区专业创作者的可托任内容。

  在他看来,处理中文语料资本欠缺的成绩,实践上该当是先构建“水库”,然后再去公道利用的历程。可是如今,行业对构建“水库”的事情正视不敷,反而都比力垂青怎样去“汲水”,以是将来几年,中文语料资本欠缺都将是一个出格严峻的成绩。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186