成人在线你懂的-成人在线免费小视频-成人在线免费网站-成人在线免费视频观看-日韩精品国产一区二区-日韩精品国产一区

掃一掃
關(guān)注微信公眾號

谷歌發(fā)布大型數(shù)據(jù)集合 以研發(fā)準(zhǔn)確翻譯軟件
2013-03-11   cnBeta

據(jù)外媒報道,谷歌于近日發(fā)布了一個大型數(shù)據(jù)集合--Wikilinks Corpus,它將可以幫助開發(fā)人員構(gòu)建出可以準(zhǔn)確解釋人類語言的軟件。Wikilinks Corpus中包含了來自各大網(wǎng)頁及維基百科文章的4000多萬條個人鏈接,它們則被稱為mention。開發(fā)人員則可以通過分析每一條mention的內(nèi)容以及目標(biāo)文章的內(nèi)容,進而確定一些模棱兩可單詞的意思。

  谷歌在其Reaserch Blog中提出,人類非常擅長辨別同一個單詞在不同語境下的意思。比如說,當(dāng)把dodge寫成Dodge時,它就是一個車子的品牌,而當(dāng)寫成to dodge的時候,它就是一個動詞。

  跟谷歌搜索算法非常類似,Wikilinks Corpus也是由在來自馬薩諸塞大學(xué)阿默斯特分校的研究人員的協(xié)助下完成的,并且它的規(guī)模要比以往的數(shù)據(jù)集合都要來得大。更重要的是,它是免費的。雖然由于版權(quán)問題,谷歌無法發(fā)布個人網(wǎng)頁的實際內(nèi)容,但是它卻可以提供獲得這些內(nèi)容的代碼。

熱詞搜索:

上一篇:甲骨文再發(fā)Java安全更新 將會加快更新速度
下一篇:5000億 2013年物聯(lián)網(wǎng)將繼續(xù)成產(chǎn)業(yè)關(guān)注熱點

分享到: 收藏
主站蜘蛛池模板: 天堂av| 1905电影网免费电影| 操蛋视频| 报团云南旅游价格| 明天属于我们法剧免费观看| 刑事侦缉档案1演员表| 浪客剑心星霜篇| 我不知道明天的道路歌词歌谱| 最可爱的人 电影| 赤月| 流浪地球2演员表| 我爱你再见演员表| 姿metcn张筱雨人体1| 汤唯和梁朝伟拍戏原版视频| 国考岗位| 钉子电影电视剧| 转正意见评语| 你从草原走来| 默读车| 摇曳庄的幽奈小姐| 黄大年主要事迹概括| 少女频道电影在线观看中文版| 翁姆| 变形金刚1免费完整版在线观看| 小女巫| 智乐星中考| 大内群英 电视剧| 4人免费剧本及答案| free gay movies| 金福南事件始末在线观看高清影评 | 网页版抖音| 田教授的28个保姆演员表| 又造句二年级上册| 循环小数除法50道| 黑帮团伙美国电影| 乔治爸爸去哪儿| 韵达快递收费标准| 都市频道今日节目表| 郑荣植个人资料| 田中敦子| 失落的星球|