第一百一十七章 百科狂人马百万-《超级U盘》


    第(2/3)页

    “语意检查引擎”被应用于所有蜜蜂科技旗下网站,根据网站性质不同,语意检查的级别和侧重点也不同。

    像是游戏软件官方bbs只专注软件使用体会与意见建议,其他内容的话题就会被拦截,无论是广告贴还是各种引占钓鱼贴。

    而像是中临协百科和中临协问答这两个子站语意检查引擎则强化了“内容查重”功能,避免复制粘贴。在问答站发布问题时如果网站上已有同样问题,就会被合并进去,答案中大段引用其他网站内容则会被标注“本段来自某某网站”的自动标记。

    因为是结合在语意检查引擎里面的,中临协网站的查重引擎效力非常强大,普通防屏蔽的方法比如加入其他文字和符号、使用同音字、同义字、形似字等,并不能逃过检查软件的法眼。

    不少大学生用户因此逐渐使用“中临协客户端”作为他们的论文查重引擎,效果相当好。这是因为马竞到开通鹭大图书馆网络平台以后,同时也把这个重量级数据来源引入查重引擎的结果。

    虽然词条数、问题数没有发展更早的度娘百科和度娘知道多,累计完成任务数也没有witkey多,但是中临协网站后发制人,凭借蜜蜂浏览器长期引流、蜜蜂科技倾力支持,在总交易额和任务类型总数两样数据上完爆了其他众包/威客网站,在内容准确性上面完爆了度娘,甚至在准确率指标上直追在线百科始祖维基百科。

    到今年,维基百科已有210多种语言的版本,词条数超过350万,英文版条目数已经超过100万条。这个开放的在线百科全书正在经历爆炸式的发展,它已经是目前世界历史上最大的百科全书。

    2005年12月14日,英国《自然》杂志随机从维基百科(wiki)抽取了42个和科学技术有关的条目并请专家与不列颠百科全书(eb)进行比较,结果发现,维基百科共有162项事实性的错误、疏漏或误导性的陈述,不列颠百科则有123项,“业余网友“打造的维基平均每条的“错误”只比芝加哥大学数百名专家持续编写的不列颠百科全书多出一个。尽管大英百科方面声称自然杂志的调查有几处证据不是来自eb本身,但是基于自然杂志在科学界的地位,大众还是相信了这个匪夷所思的结果。

    虽然马甲并没有做同样的抽查,但他还是确信自己打造的中临协百科比这二者更加准确。

    2005年12月14日,英国《自然》杂志随机从维基百科抽取了42个和科学技术有关的条目并请专家与不列颠百科全书进行比较,结果发现,维基百科共有162项事实性的错误、疏漏或误导性的陈述,不列颠百科则有123项,维基平均每条的“错误”只比不列颠百科全书多出一个。维基百科在发展的过程中也推出了一系列措施来提高条目的准确性与权威性,比如制定条目质量标准、进行特色条目的评选、采用“专题”的方式为某一特定领域范围内的条目撰写提供一个模板(应该包括哪些内容,资料如何排列与组织等)、实行“条目质量提升计划”(通过投票方式定期挑选出需要提升质量的条目放置在主页的显著位置,确定条目的框架与提纲,在规定的期限内完成更新)。

    一方面,中临协百科初始版本的80万词条都是马甲整理“编写”的,内容来自《辞海》(99版12万)、《现代汉语词典》(05版6万5)、《大英百科全书》(网络版22万5)、《牛津英汉双解词典》(40万)、《汉语字典》(6万)等成名工具书和马竞看过的各种教科书,以及竞争对手度娘百科和维基百科。

    另一方面,这些词条都由马竞通过e7u批量创建,借助反向使用“人工智能语意检查引擎”,可以与时俱进更新资料内容,同时保持描述的权威客观专业。而且借助机器人工智能,可以避免一些人为因素导致的文字错误、歧义误解等问题,可以进一步提高准确性。

    另外语意引擎也为每个词条提供多语言版本,尽管只有中(繁中)、英(美)两种语言四个版本。

    这些词条词条的创建者名字叫做“马海生”,就是马竞为了纪念自己转换词条时在海水里泡着的一个多月而特地取的。
    第(2/3)页