人工智能时代前沿技术社区

【线上直播】人工智能中的文本分类技术
 2018-10-16 20:30
300
人气

800-500副本.jpg

人工智能中的文本分类技术

分享嘉宾


黄鸿波

19ACB3B9-92FD-4adf-99C0-34FDDA9D08BB (2).png

金山软件人工智能领域专家,高级算法工程师


珠海金山办公软件有限公司(WPS)人工智能领域专家,高级算法工程师,拥有多年软件开发经验,著有《TensorFlow进阶指南 基础、算法与应用》一书。曾在格力电器股份有限公司大数据中心担任人工智能领域专家,且在多家公司担任过高级工程师,技术经理,技术总监等职务。曾带领团队开发过基于人脸识别技术的智能支付系统、推荐系统、智能问答系统等。擅长数据挖掘、机器学习、移动开发等专业领域,并拥有丰富的实战经验。


人工智能中的文本分类技术

摘要:

文本分类问题是企业在NLP领域中处理文本数据时经常会遇到的一个问题,很多时候,我们需要将文本信息进行分类,或提相关的接口以供外部进行文本上传,在wps云中,针对于用户所上传的文档信息就需要进行文档内容的分类,那么针对于这个需求我们就需要使用到文本分类的相关模型和算法进行处理。在文本分类领域中的模型和算法有很多。本次演讲就是从这个角度入手,通过对比来阐述不同的算法、模型在实际的应用过程中的区别,以及在文本分类实践中所遇到的各种坑。


分享提纲:

1. 文本分类实践中常见的误区:

1.1 深度模型一定优于传统的机器学习模型

1.2 在验证集上准确率高在线上准确率就高

1.3 准确率是文本分类中最重要的指标

1.4 越复杂的模型效果越好

2. 文本分类策略

2.1 选择合适的训练集和测试集

2.2 巧用词袋模型

3. 常用文本分类模型对比

3.1 机器学习算法对比

4.1.1 LR+词频

4.1.2 LR+one-hot

4.1.3 标准化+词频+LR

4.1.4 正则化+词频+LR

4.1.5拉普拉斯平滑+词概率+LR

4.1.6贝叶斯+词频

4.1.7贝叶斯+特征提取

3.2 深度学习模型对比

3.2.1 TextCNN

3.2.2 textRNN

3.2.3 textRCNN

3.2.4 HAN


听众收益:

1、了解在文本分类过程中的一些常见的坑

2、了解各种文本分类模型在实际工程中的取舍

3、了解各种算法在相同数据集下的真实数据对比


直播时间

2018年10月16日(周二) 20:30-21:30

直播方式

登陆飞马网报名活动后活动底部会显示微信小助手二维码,扫描小助手微信并注明 “10.16直播”小助手会拉您入群在直播开始前通知您直播频道!


活动参与人员(236)人
飞马网会员
Sam
飞马网会员
nana
飞马网会员
kickingbird
飞马网会员
eHHbe
飞马网会员
dXbba
飞马网会员
。。。。
飞马网会员
光环邢老师
飞马网会员
又又
飞马网会员
fKQLP
飞马网会员
郁君。
飞马网会员
狼和狐狸
飞马网会员
没有神
飞马网会员
bensonny
飞马网会员
嘿嘿
飞马网会员
cqc1008
飞马网会员
归零~
飞马网会员
爱看球的领带
飞马网会员
WYYQD_OK@126.com
飞马网会员
BMWx1
飞马网会员
NLYYQ
点击加载更多
免费:0元
登录