本站新(短)域名:xiguashuwu.com
第十二章 把自己当驴使唤
当然gu神1。0仅仅有分析模块和收集模块是不够的,它还需要有一个数据chu1理模块,如果说分析模块是大脑,收集模块是手脚的话,那么chu1理模块就是消化系统。
当海量的数据信息被从数据海洋中chou取chu来,需要对这些信息进行加工chu1理,将它们chu1理成数据分析模块能够利用的数据模式。
比如某个上市公司一个年度财报,里面的内容非常之多,从人事变更到企业战略,并购行为,利run营收等方面都会涉及到,而这些东西又是关键xing信息。一个数万字外加各zhong图标的财报,其中各zhong关键信息必须能够被分析模块理解并进行加工,这就是chu1理模块的主要工作了。
这个数据chu1理模块主要的功能bu分其实是自然语言chu1理,程序本shen是无法理解语言内涵的,它肯定无法理解“定向增发100万限售gu”是什么意思,这时候就需要认为给这句话进行赋值,让它变成机qi能够理解的数据信息。
比如首先进行意义分割,将定向设定为一个意义单元,将增发设定为另外一个单元,以这zhong方式将整个句子an照意义单元分割开来,分别进行赋值。
这一tao加工手段里面就牵扯到人机jiao互的语言chu1理问题,需要人为的帮助计算机去理解和chu1理人类的语言,让机qi能够看懂语法、语意单元,能够联系上下文,能够chu1理不同语境下同一个词组的不同han义。
简单来说,让机qi能够理解人类语言,这就是自然语言的主要目标,同时也是这个chu1理模块的主要功能。
分析、收集、chu1理,这三大模块是gu神1。0的主要功能结构,但是仅仅如此还是不够的,gu神还需要很多的辅助模块。
比如它需要有存储模块,所有的数据信息搜集回来,必须整理加工好,然后分类存储起来,它就像一个超级图书馆一样,必须有自己的分类和存储规则。如果没有这些,你只是简单的将它们堆放在一起,你就可以想象,当你需要从数千万本书籍当中,找chu某一页特定内容时,那将会是怎样一个痛苦而又恐怖的过程。
另外gu神还需要相应的展示和jiao互模块,gu神作为一个ruan件,它需要有自己的cao2作界面,需要能够将chu1理结果或者过程展现chu来,需要能够接收指令,进行人机jiao互。
这五个模块组合在一起,并且能够顺畅的相互pei合了,gu神系统才算基本成型,而中间肯定会有各式各类的问题不停冒chu来,这都需要莫回逐个解决掉。在使用的过程中,肯定还涉及到不停的跟新和改良,所有这些都将是莫回的工作。
an照莫回的估算,整个gu神的ti量不太可能低于100万行代码,如果想要让gu神尽可能的完mei而准确,那它的ti量绝对会翻着跟tou的往上翻。想要实现什么功能,你就必须付chu相应的代价,如果你想要让gu神的预测尽可能jing1确,那么不停的往里投入肯定是必不可少的。
这还仅仅是gu神本shen,如果想要gu神运作