语料库怎么用，语料库怎么找

2023年02月05 23:28 • • 阅读 261

本文约1000字,建议阅读5分钟。该Github库是对目前市面上已有的开源中文聊天语料的搜集和系统化整理工作。语料内容该库搜集了包含chatterbot、豆瓣多轮、PTT八卦语料、青云语料、电视剧对白

本文约1000字，建议阅读5分钟。

该Github库是对目前市面上已有的开源中文聊天语料的搜集和系统化整理工作。

语料内容

该库搜集了包含chatterbot、豆瓣多轮、PTT八卦语料、青云语料、电视剧对白语料、贴吧论坛回帖语料、微博语料小黄鸡语料共8个公开闲聊常用语料和短信，语料库怎么找，并对其进行了统一化规整和处理，达到直接可以粗略使用的目的。

使用方法

下载语料

将解压后的raw_chat_corpus文件夹放到当前目录下目录结构为：

把自己的语料库(sogou文本分类语料库)放在LTK_DATA/corpora/目录下；然后在命令行输入以下之后，即可看到所有的txt文件名列表了。

执行命令即可

python main.py

生成结果

每个来源的语料分别生成一个独立的*.tsv文件，都放在新生成的clean_chat_corpus文件夹下。

最后,可以建立英语学习者语料库。英语学习者语料库的语料素材主要来自EFL学生。建议语料库的目的就是观察各类学生的英语特征和言语失误的情况,为我国学生的英语教学提供有用的反馈信息。[7]将英语语料库引入课堂教学,可以缩小课堂上教的语言。

生成结果格式为 tsv格式，每行是一个样本，先是query，再是answer

query \t answer

校对：林亦霖

— 完 —

3、语料库特征语料库中存放的是在语言的实际使用中真实出现过的语言材料，因此例句库通常不应算作语料库；语料库是承载语言知识的基础资源，但并不等于语言知识；真实语料需要经过加工（分析和处理），才能成为有用的资源。

淘宝天猫店怎么开，怎么在天猫淘宝上开店

上一篇 2023年02月06 16:53

死或生5怎么全屏，死或生5全屏幕设置方法

下一篇 2023年01月30 21:54

科技

刚加微信怎么聊天，怎么幽默的要女生微信

现在微信聊天在我们的生活中占据了很重要的地位,当然男生在追女生的时候,也经常用到微信聊天。刚加微信的女孩子怎么聊天？终于加到女生微信却不会聊？但是有的男生会不知道,在刚加上一个女孩子的时候,不知道该怎

2023年02月14 220
科技

微博名字怎么修改，微博名字在哪里改

知洋娱乐：微博命名规则有哪些？相信不少人是有疑问的,今天深圳市知洋文化传媒有限公司就跟大家解答一下！知洋娱乐：微博命名规则有哪些如下如下：一、品牌名二、品牌名+领域或行业新浪微博、腾讯视频、搜狐博客等

2023年01月31 266
科技

qq怎么退出

稿源：太平洋电脑网QQ注销功能上线了！QQ号不想要了,换了以前只能让号荒废在那里,现在有了更好的解决方式,那就是可以把号注销了,那么怎么样才能注销QQ号呢？跟着小编来看看如何操作吧。需要注意的是,这里

2023年02月09 265
科技

怎么撤回邮件，outlook找不到撤回功能

您是否有过下面的这些社死尴尬经历？刚刚发完电子邮件,想到某些附件或重要内容还没有填写完整；1.我们先点击已发送栏,然后选择需要撤回的邮件,点击进去2.点击上方的撤回邮件按钮3.如果出现以下图片（操作成

2023年01月17 255
科技

怎么登陆谷歌

IT之家11月1日消息十月是美国的国家网络安全宣传月,针对于此,谷歌推出了一系列与登录流程和帐户使用相关的新功能。其中值得注意的一项是,谷歌要求在登录账号进行安全检查期间,以及删除有害应用时,必须启用

2023年02月04 244
科技

word怎么下一页，word向下新增一页快捷键

word向下新增一页快捷键,要想在Word文档中添加下一页,其实有很多办法,小编今天就分别说说这些方法,用WPS软件给大家演示一下操作步骤：方法一：键盘快捷键添加word文档添加下一页有几种方法：一、

2023年02月04 237
科技

睿频怎么开，CPU睿频要自己开吗

有网友曾表示,自己在安装了某大师之后,电脑莫名其妙就变卡顿了。大家对这有什么猜测吗？1、首先进入电源管理软件,在基本界面下将模式调节为高性能。2、在CPU技术设置选项中,找到IntelTurboMod

2023年01月20 214
科技

苹果怎么恢复短信，苹果恢复30天内误删的短信

虽然现在大部分手机用户使用微信、QQ等进行社交,但是短信的重要性也不容忽视。毕竟一个手机号可注册绑定许多平台,接收的部分通知短信也是十分重要的。我们知道iPhone是没有短信回收箱的。那么,苹果手机重

2023年02月14 228
科技

怎么更新驱动，NVIDIA显卡驱动怎么更新

硬件的各项功能都需要驱动去支持运行,NVIDIA显卡驱动怎么更新,如果驱动出现问题或版本跟不上,那么有的功能可能就不能正常运行了,本文将和大家分享一下Win10系统怎么更新驱动。系统：win10专业版

2023年02月03 243
科技

索引怎么用，数据库怎么使用索引查询

数据库索引建立原则主键不能添加聚集索引在有主键的情况下,要先接触初见的聚集,才能再在其他字段建立聚集索引。数据库索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信

2023年01月17 204
科技

路由器怎么连，新买的wifi路由器怎么安装

现在许多家庭都用上了200M或者以上的网络了,但是设备和线路等可能都没有更新,供应商说是已经升级到几百兆网络水准了,新买的wifi路由器怎么安装,但是家里的网络可能并没有达到,可能还是百兆以下宽带的水

2023年02月10 247
科技

微信怎么关联微信，如何关联微信号不被发现

功能一：语音转文字如何关联微信号不被发现,当我们需要转换的文字较少又不想下载软件时,可以直接使用社交聊天软件来实现语音转文字操作！我们可以打开聊天框,“长按说话”直接转录成文字发送,也可以发送语音后长

2023年02月10 265
科技

怎么打开exe文件，安卓手机怎么打开exe文件

可执行文件（EXE文件）是一种计算机文件,其中包含经过编码的指令序列,当用户单击文件图标时,系统可以直接执行这些指令序列。可执行文件通常具有EXE文件扩展名,但还有数百种其他可执行文件格式。某些可执行

2023年01月17 229

语料库怎么用，语料库怎么找

相关推荐