AI有一招,或许能让“王思聪们”没币可撒


  • 来源:脑极体
  • 时间:2018-01-17
  • 分类:热点资讯

(摄图网)

    曾记得十几天之前否?那时我们踌躇满志的跨进了2018,满怀着对未来的渴望,然后我们惊奇地发现,2018第一个火起来的词叫“撒币”…...

    不是我说啥,这可真出戏啊。

    似乎一夜之间,直播答题和这个叫做”撒币”的关键词就火了。王思聪的冲顶大会、映客的芝士超人、花椒的百万赢家,一时之间大佬们疯狂争当“大撒币”,人民群众则纷纷出头想当被币砸到的那个幸运儿。

    当然了,不管这些平台们如何“撒”,最终“币”还是要回到他们自己口袋里的,毕竟做生意是为了赚钱,搞出来这么大场面当然是为了放后招,没听说过哪位出题让人答是为了做慈善的。除非来答题的是个AI,说不定能干到王思聪、周鸿祎们没币可撒......

    毕竟,答题也是讲科学的对不对?

    AI答题这件事其实也不新鲜,不信你百度输入一个“长城有多长”之类的问题,马上就会给你找出来答案。这里就是用了AI的专业答题“姿势”:知识图谱。

    借着直播答题的春风,今天我们来讲讲知识图谱吧。虽然在机器视觉、语音交互等“网红技术”面前,作为AI重要分支之一的知识图谱似乎不那么出位。但是以应用程度和脑洞指数来说,这个技术绝对当仁不让。更重要的是,在“AI感知”通向“AI理解”的大路上,知识图谱近乎是无法绕开的一道关卡。

    更更重要的是,它能帮你答题啊……

    知识图谱是什么?

    知识图谱这个概念的提出时间并不算太久,但是要追根溯源理解这个技术到底是玩什么的,那可能真要往上倒腾几十年才行。

    上世纪40年代,人工智能被提出之后,无数科学家们就开始琢磨,到底用什么方式能让机器模拟出人的智慧呢?琢磨来琢磨去,人对于信息能够进行关联理解似乎是个路子。所谓信息关联,就是人类在接受一个信息后,会把它放在记忆中进行归纳和调用。比如说你打小认识了你三舅,绝不可能过几年管他叫二哥......

    利用这个思路,上世纪50年代末,学术界提出了语义网络(semanticnetwork)的设想,打算把数据进行结构化的处理,让单个信息组合成有联系、能共鸣的“知识”。今天我们用到的很多技术都来源于语义网络,比如机器翻译、自然语言处理等等,知识图谱也是其中之一。

    上世纪80年代,受到多方面刺激的地球人开始了一次AI复兴运动,而这次运动的主角,就是各国开始打造专家系统和知识库。那时候科学家们相信,如果把人类大量知识进行逻辑化关联和语义网络存储,最终人类就能打造出全知全能,啥都懂的人工智能。可惜好景不长,最终AI没等来呢,PC先来了,专家系统纷纷被弃置,但是海量知识构成的知识库却流传了下来。

    2012年,基于语义Web技术和Freebase等优质知识库,谷歌宣布推出了知识图谱(KnowledgeGraph)概念,并在2013年投入使用。所谓知识图谱,实际上是建立在网页百科知识库基础上,利用语义网络进行知识关联的技术。它可以用来帮助学术人员快速搜集和理解信息,也可以用来分析情报,辨别信息真伪。在产业端则为搜索、内容推荐和智能问答提供了基础,成为今天AI领域不是十分热门,却也足够强势的一个技术类别。

    如果说了这么多还没明白,那就举个直白的例子吧:

    假如,你这几天很好奇一个叫PGONE的词为啥火了,然后你去搜索一下,结果给你推荐的词是PGTWO、PGTHREE......那你就跟没搜一样。假如蹦出来两个词,一个是贾乃亮,一个是地沟油,那么你就了然了嘛。

    所谓的知识图谱,就是让智能体去理解知识之间网络关系,并能主动以此提供服务的技术。

    今天的知识图谱可专治各种“撒币”

    上文说了知识图谱专治各种“撒币”行为,并不是随便讲讲的。我们要知道,2002年知识图谱技术如果跟王思聪们刚一波正面,那是基本没有胜算的。

    这里有几种可能:首先是假如你的知识库是更新到前年的,人家问你PGONE的嫂子是谁你怎么办?或者人家不问你长城有多长,问你最长的墙有多长你怎么办?

    在考验真人的直播答题过程中,可能面临各种语言上的调整、提问方式的改变,以及加入最新信息。这都是几年前基于单一结构知识库的知识图谱技术难以胜任的。

    这就把知识图谱难住了吗?不能够,毕竟为答题而生,必须要搞点新高度出来才行。

    这项技术在近几年间发生了重要变化,比如:

    1.大数据+机器学习带来了史无前例的效率契机

    今天的AI复兴,是建立在机器学习驱动大数据的基础上的,知识图谱也是如此。举例来说,搜索引擎知识图谱技术,是建立在搜索数据和百科、问答等数据库之上的。数据本身的优质化是知识图谱运行的基础。而在机器学习、深度学习领域的积累,则让图谱技术实现了及时化、逐步完善图谱关联强度和理解力提升。换句话说,知识图谱技术正在变得愈发即时性与可成长。

    2.语音交互成为启动知识图谱的新形式

    让知识图谱想要真的为人类所用,那么就不能是人类用固定方式去触发知识图谱的模板。而应该是知识图谱主动理解人类的语言和思维习惯,做到主动输出服务。这就需要知识图谱与语音交互紧密结合。

    3.强语义理解能力成为关键

    能听懂“长城有多长”,却听不懂“长城从东到西一共有多少距离”的知识图谱,显然是知识没谱。深度学习各种语意、语义、语序和方言的知识图谱能力,也成为了目前知识图谱技术的唤醒核心。

    这几种能力加持下,把知识图谱伪装成选手去搞“撒币”,显然已经不算什么了......但是如果只干这点事,其实也蛮亏的。

    “撒”出一个明天

    无论是语音交互还是机器视觉,我们今天正在努力教会AI一件事,那就是识别。可是,在识别之后呢?AI下一步要干什么?识别的下一步当然是理解和处理,但如果想让AI开启这些能力,很多人都认为,知识图谱的爆发将是AI下一步的必经之路。

    知识图谱的核心,在于通过数据生成可视化的知识链条,用链条形成网络,利用网络来进行预测、生成自动化,最终生成机器主动提供的智能化服务。

    要知道,人类理解世界并不是基于一个个散乱的信息,而是基于信息背后的“知识”。

    我们期待的知识图谱技术,是通过这种技术的完善,把AI调整到主动输出服务模式。传统计算时代是你想到的,电脑帮你做出来。而知识图谱时代,是你想不到的,AI可以想到。

    能做到这一步的AI技术,当然不会只满足去答题,做个直播。人家的使命是改变世界好不好?

    其实,知识图谱作为一种隐藏的后端技术,今天已经悄然布局在我们生活的方方面面。比如我们今天在百度搜“李白写过哪些饮酒诗?”,已经不是跳出来有这些关键词的网站,而是直接跳出来你想要的答案,这背后就是知识图谱解答了你的问题。

    更重要的是,知识图谱技术作为AI交互手段的必要触达点,正在为其他AI产业提供帮助,比如智能处理、无人驾驶。更远的未来,或许是利用知识图谱技术达成物联网间的协作、人机交互的全新升级,能做的远远不止于答题这一件小事。

    所以呢,直播平台上谁给谁撒币,谁是大撒币,其实也不是很重要了。真正重要的是,技术正在努力把未来的币,撒到现在的土壤里。


[上一篇] 互金巨头们的2018:分化、转型及潜在黑天鹅

[下一篇] 2017年企业数字化发展如何?报告称深杭超越北上广