我实验室文章被MSN评选为会议最佳论文
发布时间:2019-12-19浏览次数:419
12月12日,由李安然,张兰(老师),钱建威,肖翔,李向阳(老师),谢筠庭合作的文章《TODQA: Efficient Task-oriented Data Quality Assessment》被国际会议MSN 2019评选为会议最佳论文。
该论文提出了一种高效的面向任务的大规模数据集质量评估方法。针对给定任务(例如:图片分类,本文分类等),该方法可对数据集进行内在质量(正确性,一致性,完整性,时效性等)和面向特定任务的上下文质量(任务相关性,数据多样性等)评估,并返回综合考虑各种质量结果的数据集排序。文章所提出的基于采样高效算法,在针对大规模数据集进行上下文质量评估时刻在损失0.34%精度的情况下节省90%的计算时间。
该文章获得评审意见一致高度评价,称“This paper proposes a very comprehensive large-scale datasets quality assessment framework, which is a fundamental contribution to machine learning and data mining research.”