分类专栏:NE&GNN论文文章标签:HIN表示学习综述韩家炜版权声明:本文为博主原创文章,遵循C.0BY-SA版权协议,转载请附上原文出处链接和本声明。
本文就介绍一篇来自「伊利诺伊大学香槟分校韩家炜老师课题组」的EMNLP20论文《TextClassificationUsingLabelNamesOnly:ALanguageModelSelf-TrainingApproach》。这篇论文的最大亮点就是:不需要任何标注数据,只需利用标签名称,就在四个分类数据上获得了近90%的准确率!
本文JayJay就介绍一篇来自「伊利诺伊大学香槟分校韩家炜老师课题组」的EMNLP20论文《TextClassificationUsingLabelNamesOnly:ALanguageModelSelf-TrainingApproach》。这篇论文的最大亮点就是:不需要任何标注数据,只需利用标签名称就在四个
论文被引数在6万及以上的学者,有14位。按照引用次数排名分别是:韩家炜、吴恩达、孙剑、何恺明、李飞飞、黄煦涛、任少卿、俞士纶、贾扬清、张磊、张祥雨、汤晓鸥和宋晓东。
韩家炜这里简单举了他们之前的一些研究,可以看到Network/TextCube有多么强大,这也侧面反映了为什么在挖掘数据时要先把数据结构化;3.如何从无结构文本中挖掘出结构。韩家炜认为从无结构文本中挖掘出结构是当前数据挖掘研究的重中之重。
论文被引数在6万及以上的学者,有14位。.按照引用次数排名分别是:韩家炜、吴恩达、孙剑、何恺明、李飞飞、黄煦涛、任少卿、俞士纶、贾扬清、张磊、张祥雨、汤晓鸥和宋晓东。.另外一个有趣的现象是,有些学者并没有发表太多论文,但已经取得了6...
韩家炜在数据挖掘、数据库和信息网络领域发表论文数百篇,在GoogleScholar上的被引用量接近17万次,h-index高达169,被誉为“数据挖掘第一人”。韩家炜父亲上海交大毕业,是郑州纺织机械厂任财务科长兼总会计师。
韩家炜认为要想将现有的无结构的BigData变成有用的Knowledge,首先要做的就是将数据结构化。他提出两种结构化数据的形式,一种是异质网络(HeterogeneousNetwork),另一种是文本立方体(Multi-dimensionalTextCube)。
专访数据挖掘领头人韩家炜教授:不要迷信权威,做学问要秉承「三个真实」.由中国人工智能协会、深圳罗湖区人民主办的「CCAI2018中国人工智能大会」于7月28-29日在深圳召开。.作为第二天的大会嘉宾,美国伊利诺伊大学香槟分校(UIUC)计算机系教授...
微软+韩家炜课题组的全面调研:NER标注数据少,怎么办?.少样本问题是NLPer必须直面的一个棘手问题。.BERT等预训练语言模型的兴起,确实会在一定程度上缓解少样本问题。.毕竟,原来的那种「大模型、少样本」会造成严重的过拟合。.只有BERT还远远不够...