穿越:2014_第100章 留评率高得离谱 首页

字体:      护眼 关灯

上一页 目录 下一页

   第100章 留评率高得离谱 (第6/9页)

一,运用语言模型来评估算法生成语言的流畅度;

    第二,使用相似度模型评估文本和摘要之间的语义相关性;

    第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。

    然鹅也仅仅是说起来很简单而已。

    说到把大象放进冰箱也很简单同样是三步:

    ——打开冰箱门,放进大象,关上冰箱门。

    知道怎么做没用,关键还是要执行。

    没办法执行的话,步骤再清晰也没用。

    LH文本摘要准确度衡量模型的构建过程有三步。

    第一步就很复杂。

    该怎么进行语言模型的构建呢?

    按照LINHUI提出的技术路线。

    语言模型建模过程中,包括词典、语料、模型选择等。

    问题出在语料库上,语料库一词在语言学上意指大量的文本。

    这类文本通常经过整理,具有既定格式与标记。

    涉及到英文语料库的信息还比较容易,毕竟伊芙所在的团队和牛津、哈佛、耶鲁三所大学的语言学方面都是深度合作的关系。

    但涉及到中文以及其他文字预料信息该怎么处理这就完全不好说了。

    巧妇难为无米之炊。

    没有语料库清楚技术路线什么的也没用。

    倒是可以姑且先抛弃对中文以及其他新闻生成式摘要的研究。

    但是这样几乎等同于放弃了一个庞大的市场。

    而且最关键的是LINHUI提出的算法本身就能兼顾中文新闻摘要以及英文新闻摘要。

    那么之后LINHUI会不会直接开发个中文新闻处理成英文摘要的功能呢
加入书签 我的书架

上一页 目录 下一页