您好,欢迎来到筏尚旅游网。
搜索
您的当前位置:首页基于跨语言词向量表示和分类器联合训练的跨语言文本分类方法[发明专利]

基于跨语言词向量表示和分类器联合训练的跨语言文本分类方法[发明专利]

来源:筏尚旅游网
专利内容由知识产权出版社提供

专利名称:基于跨语言词向量表示和分类器联合训练的跨语言

文本分类方法

专利类型:发明专利

发明人:曹海龙,杨沐昀,赵铁军,高国骥申请号:CN201810680474.3申请日:20180627公开号:CN1060317A公开日:20181207

摘要:基于跨语言词向量表示和分类器联合训练的跨语言文本分类方法,本发明涉及跨语言文本分类方法。本发明的目的是为了解决现有基于同义词替换的方法分类准确率低,现有基于翻译的方法准确率较高,但是训练翻译器需要大量的语料,而且训练耗时较长,任务的复杂性与时间消耗远远超过了文本分类这一较为简单的任务,因此并不实用的问题。过程为:一:语料预处理:二:通过梯度优化方法优化总的损失函数,使总的损失函数达到最小值,对应一组词向量和一个分类器;三:取概率最大的标签作为目标端语言T上的测试文本的分类结果;与测试集的标准结果对比,得到测试准确率和召回率指标。本发明用于跨语言文本分类领域。

申请人:哈尔滨工业大学

地址:150001 黑龙江省哈尔滨市南岗区西大直街92号

国籍:CN

代理机构:哈尔滨市松花江专利商标事务所

代理人:岳泉清

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务