
山西大学人工智能研究团队在谱聚类研究方面取得重要进展
近期,山西大学人工智能研究团队在自学习谱聚类的理论与方法研究中取得重要进展,相关成果《Spectral Clustering with Robust Self-Learning Constraints》已发表在人工智能领域国际顶级期刊Artificial Intelligence上。该论文通讯作者为梁吉业教授,第一作者为白亮教授,合作者为2021级博士生祁敏学。
谱聚类是一种极具代表性的无监督机器学习范式,其相关技术已在计算机视觉、社交网络、精准医疗等领域取得了巨大的成功。然而,现有谱聚类模型更多强调学习无标记数据之间的一致性去探索数据的潜在类结构,忽略了它们的判别性对训练无监督模型的重要性。通过大量实验发现少量带有判别性的先验信息的介入可以极大地提升模型在分类任务上的表现。然而,从无标记数据中获取这些先验信息是极其困难的。此外,先验信息的准确性对模型影响巨大,错误的先验信息往往会严重影响模型的性能。如何从无标记数据中自学习高质量的判别信息去提升模型的有效性是一项具有挑战性的任务。
图1 高鲁棒的自学习谱聚类模型框架
针对这一挑战,研究团队提出了高鲁棒的自学习谱聚类模型(见图1)。该模型借鉴集成学习的思想,从无标注数据中自学习多组监督信息,通过求解它们之间的最大一致性去增强谱聚类模型的判别性。相比现有方法,新模型能够学到更加鲁棒的监督信息和聚类结果,并通过大量实验对比验证了它的有效性(见图2)。
图2 模型和现有方法的有效性比较
同时,团队提供了该模型的相关理论分析:(1)从泛化性的角度出发,证明了自学习的判别信息能够提升谱聚类模型的泛化能力。(2)从稳定性角度出发,证明了自学习多组监督信息相比单组监督信息能够帮助谱聚类模型得到更加鲁棒的聚类结果。(3)从收敛性的角度出发,证明了该模型能够在有限次迭代中收敛。
图3 模型的理论分析
研究工作得到了科技创新2030-“新一代人工智能”重大项目、国家优秀青年科学基金、山西省1331工程重点学科建设计划的支持。
研究成果原文阅读链接
https://doi.org/10.1016/j.artint.2023.103924
最近更新教育活动
- “创新创业+”教育新模式 让这所高职院校交出亮眼成绩单
- 田浩江×毛尖|《角斗场的<图兰朵>》:重新发现汉语呼吸系统
- 冠军诞生!
- 悬疑小说在网文平台走红背后《十日终焉》作者:我的写作是一场与读者的博弈
- 解读广州前三季度“成绩单”:新动能持续发力 发展质效稳步提升
- 辽宁科技大学机械工程自动化学院:推进产教融合 助力科技成果转化
- 全国现当代文学青年学者汇聚上海大学,深度讨论人文学术
- 揽胜运动:成都挑战者的聚集地
- 探索“有趣高效”课堂!郑州24中第十四届常规教学质量月活动启动
- 拼搏路上洒下如花歌吟
- 山东人社出台三年行动方案,完善工资收入分配有这些大招
- 近300件百年意大利展品在渝开展 展示欧洲艺术设计传承和发展
- 儿童友好|“竹够精彩”
- 报考托福有什么要求
- 高等教育高质量发展|遵义职院:提升办学质量 培养高素质职教人才
- 网售处方药监管趋严
- 玉米播种机“水土不服” 四川岳池破解乡村人才匮乏 引来的博士科研团队小试牛刀
- 2023秋季仲景健康节缤纷活动花式养生,中医药文化蓬勃绽放
- 原创中冠广州影豹2-1击败上海同济,将与彬州辉龙争夺一个冲乙名额
- 托福独立作文没写完
- 高考报名明日启动,这些重要事项须明晰!
- 让老年人都有幸福美满的晚年
- 创意展活力 数字赋新生
- 西南交大、石室中学与郫都区三方携手 西南交大实验小学揭牌启用
- 江门摩托车又回来了