第302章 自然语言处理-《重生之王牌黑客》


    第(2/3)页

    杨静宸显然对这个领域很熟悉,给肖远介绍了一下当前国际上关于这方面的研究情况,然后又说了国内的研究情况:“咱们国内对这方面的研究,相比国外,还处于一个水平更低的基础信息积累阶段,一方面是因为国内的起步比西方晚,二来,是因为,中文和西方拉丁语系的那些语言有很大不同,拉丁语系是拼音语系,而且句式本身就是结构化的,所以计算机处理起来也相对容易,但是中文却是一种古老的象形文字,句式灵活随意,充满了各种虚词助词,想将这样的语言转化成计算机可以分析处理的形式,本身就是一个很大的难题。”

    “嗯,这倒是事实,那么咱们国家现在的研究状况究竟是什么样子的?”听了老妈的话,肖远稍稍有些失望,前世他也只是稍稍关注过这方面的理论,具体的细节了解也不是太多,于是就想更深入的了解一些。

    “现在国内进行这方面研究的,主要是几个大学,其中京华大学的研究比较前沿,国内其他大学在这方面的研究,也大都在配合京华大学的研究,做一些基础词库整理工作,妈的实验室也有人在做这方面的研究,主要承担的是h到p的词汇整理建库工作,目前完成度已经到百分之八十了。”杨静宸说道。

    听了杨静宸的介绍,肖远说道:“基础词库大概什么时候能够建好?”

    “这个很难估计。”杨静宸说道,说完看到肖远眉头皱了起来,又说道,“你要真的想在搜索引擎中使用自然语言处理算法,妈倒是能给你一些建议。”

    肖远用询问的目光看着老妈,等着她继续。

    “人们要利用你说的搜索引擎在网上检索信息的话,我想他们用的最多的,肯定不会是完整的句子,而是一些关键词,或者一些短句,仅仅分析关键词和短句的话,难度就没有那么大了,而且你也没必要一下子就把产品做的那么完美,人们以前从来没有接触过这样的产品,所以,只需要一些简单的智能性,就足以对用户产生足够的吸引力了。”杨静宸说道。

    肖远点了点头,说道:“这个我自然是知道的,不过咱们国内的研究状况让我有些失望罢了,第一版肯定不能一下子往里面放太多的东西,只需要做出一个基本的东西,然后根据用户的反馈和新技术的成熟,再扩充,让它越来越完善,这好像是软件工程上有名的xp编程。”

    “你知道xp编程?”

    杨静宸却是因为肖远提到xp编程(此处的xp指的是extremeprogramming的简写,极限编程的意思,而indosxp中的xp指的是experiennetdosxp之说。)感到很惊讶,大概是想不到肖远还会去看软件工程方面的书吧,更何况xp开方法还是近几年才有人提出来的一种很新的方法。

    “了解一些。”肖远却是没有想到自己随口的一句话,都能让老妈感到惊讶,于是就把话题又拉回了正题,说道,“妈,我倒有个想法。”
    第(2/3)页