重生我不想当男神完整版_201 秦雨诺：他把我当问答模型了？-笔趣阁

　　。

　　这其实也是模拟人类交流的过程，当你提出问题的时候，不可能指望别人立刻进行回答，都是在明确对方需求以后，再给出进一步的反馈，越反馈越正确，因为你提的要求越难越多，对方需要寻找的范围也越来越，越来越精准。

　　只是交流五次就回答出这个问题，周岩还是比较意外的。

　　于是他改变了思路，选择提出一个大项目，让01首先提供完成这个大项目需要的步骤。

　　而很快，01就给出了步骤，一共五点。

　　周岩给出的要求是：对网络文本进行文本统计分析。

　　01的回复是：1、导入文本。2、文本预处理。3、文本统计。4、得出结论。

　　比较简单，周岩给出具体一点的要求。

　　于是01的回复变成了：1、导入文本。2、对文本进行预处理，导入停用词表，使用分词工具对文本进行预处理。3、对处理后的分词文本，进行词频统计。4、对词频统计后的结果进行词频统计分析，得出结论。

　　具体了一些，只不过依旧有点儿宽泛。

　　不过周岩等不及了，

　　他直接提出让01根据自己的步骤，生成相关的代码。

　　而很快，01就生成了一系列的代码。

　　周岩下载了《斗破苍穹》的文本，对这段代码进行验证，很快就得到了不错的数据，虽然不全面，但显然这个项目是能进行下去的。

　　周岩又对这段代码提出改进要求，包括词频可视化，把词频用云图展现出来，包括对词频进行文本训练，从而找出词与词之间的关联。

　　这一回周岩提出的要求是对两本文本进行处理，两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》。

　　很快01给出了相应的代码修改，周岩复制粘贴之后，进行测试。

　　其实需求也特别简单，就是找主角之间的人物关系。

　　杨过对应龙女，那么郭靖对应什么，结果：黄蓉。

　　周岩又找了杨过和郭靖分别对应的关联词，同时让01局限在人物身上，自己设计一个人物词判定代码。

　　这一回01终于出现了一点错误，比如人物切分上面，会把4个词的人物变成2个词输出。

　　这就是细节上的毛病了，周岩现在也不是算法白，知道怎么改进，不过周岩更期待01给出的结果。

　　于是他把这个问题粘贴给了01，而01也给出了对词频进行判定，如果两个拆分的词同时出现多次，那么判定两个拆分的词合并成为同一个词，并在字典中删除前面两个拆分词，并对已经分词好的数据进行处理，合并两个拆分词，没有分词好的就以该拆分词作为分词依据，照着分词就校

　　粘贴进去以后，周岩发现效果意外的不错。

　　只是之后人物判别上也出现了一些问题，会把武器什么的加进去。

　　周岩又去问01，01回答了一些代码修改，但加进去以后，依旧是老样子，没法做到细致的划分。

　　周岩问01有没有什么好的办法，01在处理之前，就把处理的人物给预设出来，这样就不会出现之后判定错误的情况。

　　也就是从源头解决问题，同样也算是一件很机械的处理方式。

　　但是人类有时候的处理，同样很机械，而且也是填鸭式的，就比如基因测序。

　　请收藏：https://m.bqtxt.cc