娱乐设备

今日热搜丨文本挖掘

发布时间:2024/10/10 15:17:43   
北京白癜风医院哪家最好 https://wapjbk.39.net/yiyuanfengcai/yyjs_bjzkbdfyy/

目前存储信息的

最一般形式是文本,

通常一些视频和音频文件

也都会转换成文本信息,

所以有人认为文本挖掘的商业潜能

甚至比数据挖掘还要高。

什么是文本挖掘

  文本挖掘即指利用计算机从非结构化的文本中自动发现隐含的、未知的、有价值的信息或知识的过程。典型的文本挖掘方法包括文本分类、文本聚类、概念/实体抽取、观点分析、文档摘要和实体关系模型构建等。

文本挖掘涉及多个学科领域

  对文本信息的挖掘主要是以数理统计学和计算语言学为理论基础,让计算机发现某些文字出现的规律以及文字与语义、语法间的联系。文本挖掘处理的对象是非结构化的文本数据,这是一件很复杂的工作,涉及多个学科领域,如信息检索、文本分析、信息抽取、自动聚类、自动分类、可视化技术、数据库技术、机器学习和数据挖掘等。

探索与应用

  大数据时代,人们可轻松获得并利用技术资料、商业信息、新闻报道、自媒体短文本、娱乐资讯等多种类别和形式的文档,构成一个异常庞大的具有异构性、开放性特点的语料库,通过文本挖掘技术的分析提取,常常会获得巨大的商业价值。目前,在网络舆情、风险管理、情景广告、商业智能、垃圾邮件过滤等领域都广泛应用了文本挖掘技术。

香港浸会大学(浸大)“助减香港市民疫苗犹豫”研究计划

  年,香港浸会大学(浸大)推出“助减香港市民疫苗犹豫”研究计划,研究从传播学入手,运用最先进的人工智能计算分析方法,并通过问卷调查、问卷实验、媒体数据文本挖掘和分析等研究方法,持续发布动态、有效的科研成果,提供分析建议,旨在破解香港“疫苗犹豫”现象的背后因素。

01:00

国家电网公司展出电力专用GridGraph图数据库

  世界人工智能大会中,国家电网公司共有8个参展项目。其中自主研发的电力专用GridGraph图数据库,能实现电力设备知识图谱“零知识”构建能力,内置电力行业共性、基础性概念、属性、关系等本体体系,覆盖电力设备、调度等业务领域,通过文本挖掘、OCR等组件,快速完成电力设备知识图谱的构建。

重庆银行精准适老服务创新案例完成手机银行App端体验优化和线上运营精细化

  在“年中国金融创新奖”评选活动中,重庆银行以手机银行关爱版为代表的精准适老服务创新案例脱颖而出,该案例基于文本挖掘技术的需求精准识别和从老年人的视角出发,充分考虑老年人的生理特点、心理认知特点和使用习惯进行系统设计,完成了对老年一族进行有针对性的手机银行App端体验优化和线上运营精细化。

(来源:综合自人民网、全国科学技术名词审定委员会、中国新闻网等)



转载请注明:http://www.aideyishus.com/lktp/7000.html
------分隔线----------------------------