2024年京师—大湾区数据科学与大数据及人工智能青年学者论坛

2024年京师—大湾区数据科学与大数据及人工智能青年学者论坛

珠海市计算机学会 2024年07月15日 10:55 广东

1. 论坛宗旨:

     响应创新型国家发展战略,坚持科技事业发展的“四个面向”,依托珠海市计算机学会、北京师范大学珠海校区数据科学与大数据专业、人工智能专业的研发基础和优势,提升人才培养质量与科产教融合深度,促进北京师范大学在大湾区数据科学与大数据、人工智能技术的深入交流与研发应用,实现高质量创新发展。

2. 论坛内容:

     数据科学与大数据、人工智能前沿技术探讨

3.  论坛时间:2024 年 7 月 16日上午9:40~12:00

4.  论坛地点:#腾讯会议号:622 546 473

5.  论坛组织:

 珠海市计算机学会

 北京师范大学珠海校区数据科学与大数据系

 北京师范大学智能工程与教育应用研究中心

6. 论坛报告:

序号

报告题目

报告人

单位/职务

1

A semiparametric Gaussian mixture model for chest CT-based   3D blood vessel reconstruction

曾千涵

北京大学光华管理学院博士生

2

空间多组学整合算法研究

周翔

广东省智能科学与技术研究院博士后

3

基于知识图谱的大规模语言模型知识增强研究

张庆刚

香港理工大学计算机系博士生

4

非线性随机动态系统的粒子滤波与平滑

陈云起

南方科技大学控制理论与技术中心段广仁院士课题组博士后

5

基于生成模型的零样本学习算法研究

马培荣

复旦大学博士生

6

智能数据可视分析

刘灿

北京大学智能学院博士

 

论坛报告介绍 

1) 报告人:曾千涵

     北京大学光华管理学院在读博士生,师从王汉生教授,研究方向包括医学图像分析、非参数估计和数据标注等,获得北京应用统计学会学术研讨会优秀论文奖,相关成果发表在Biostatistics和Statistics and Its Interface上。

报告题目: A semiparametric Gaussian mixture model for chest CT-based 3D blood vessel reconstruction

报告摘要:Computed tomography (CT) has been a powerful diagnostic tool since its emergence in the 1970s. Using CT data, three-dimensional (3D) structures of human internal organs and tissues, such as blood vessels, can be reconstructed using professional software. This 3D reconstruction is crucial for surgical operations and can serve as a vivid medical teaching example. However, traditional 3D reconstruction heavily relies on manual operations, which are time-consuming, subjective, and require substantial experience. To address this problem, we develop a novel semiparametric Gaussian mixture model tailored for the 3D reconstruction of blood vessels. This model extends the classical Gaussian mixture model by enabling nonparametric variations in the component-wise parameters of interest according to voxel positions. We develop a kernel-based expectation-maximization algorithm for estimating the model parameters, accompanied by a supporting asymptotic theory. Furthermore, we propose a novel regression method for optimal bandwidth selection. Compared to the conventional cross-validation-based (CV) method, the regression method outperforms the CV method in terms of computational and statistical efficiency. In application, this methodology facilitates the fully automated reconstruction of 3D blood vessel structures with remarkable accuracy.


 

2)报告人:周翔

  广东省智能科学与技术研究院博士后,博士毕业于中山大学计算机学院。主要研究方向为机器学习和深度学习方法在单细胞和空间多组学数据分析中的应用。相关成果发表于Nature Computational Science,Briefings in Bioinformatics,GigaScience,RECOMB 等国际知名期刊和会议上。

报告题目:空间多组学整合算法研究

报告摘要:随着单细胞与空间组学测序技术的快速发展,跨平台、跨组学等多模态的生物大数据,正在快速的积累。如何有效整合这一系列数据,弥补不同测序技术的不足,助力新的生物学发现,是生物信息学领域的一个核心研究问题。本报告将介绍一种新型整合工具,可以有效整合来自不同技术、不同发育时间点、不同疾病条件的多切片空间转录组数据,为揭示生物组织结构中空间位置特异的基因调控机制,构建空间多组学图谱提供帮助。


 

3)报告人:张庆刚

  目前是香港理工大学计算机系的一名三年级博士生。他在西北工业大学完成本科学业后,于2021年直接进入香港理工大学计算机系攻读博士学位,师从黄啸和曹建农教授。张博士的研究兴趣主要集中在图神经网络和知识图谱领域。他致力于将知识图谱与大规模语言模型相结合,以实现在特定领域内具有可靠性和可解释性的知识推理。自2021年博士入学以来的三年内,他已在数据挖掘和自然语言处理领域的顶级会议和期刊上发表了5篇一作(含共一)文章,其中4篇发表在CCF A类会议和期刊上,包括KDD'24、ACL'24、WWW'23和TKDE'23。

报告题目:基于知识图谱的大规模语言模型知识增强研究

报告摘要:本报告聚焦于当前大语言模型 (LLMs) 在实际应用中所面临的一个关键问题——在处理超出其知识领域的任务时,倾向于生成不准确的陈述,即所谓的"幻觉"现象。为了缓解这一问题,研究人员开始探索利用知识图谱 (KGs) 中的事实知识来约束 LLMs 的响应。然而,大多数 LLMs 都未开源,仅使用硬提示 (hard prompt) 来开发一个能有效整合知识图谱的学习框架存在诸多挑战。本报告中张博士介绍了一种新型的基于知识图谱的提示框架——KnowGPT。通过 KnowGPT ,LLMs 能够更加智能、高效地利用知识图谱中的事实知识,从而生成更加准确、合理的响应。这项研究有望推动知识图谱增强型 LLMs 在各个领域的实际应用,使 LLMs 能够在更广泛的任务中提供可靠的推理结果。


 

4)报告人:陈云起

  现为南方科技大学控制理论与技术中心段广仁院士课题组博士后。陈云起博士于2015年6月获中国海洋大学信息与计算科学学士学位,2017年7月获哈尔滨工业大学概率论与数理统计硕士学位,2022年6月获哈尔滨工业大学控制科学与工程博士学位。在读期间多次获得国家奖学金与国家励志奖学金,同时获得“优秀学生”、“优秀学生干部”、“优秀毕业生”、“优秀青年志愿者”等荣誉称号。自博士阶段起从事粒子滤波与平滑在目标跟踪应用方面的研究,截止目前已发表学术论文11篇,其中包括:SCI一作论文5篇、EI会议论文4篇、SCI三作论文2篇。此外,还担任IEEE TAC、Automatica、ISA Trans.、Appl. Math. Model.、IFAC World Congress、中国控制会议(CCC)等多个国际期刊与会议审稿人,并承担国家级、省部级、市级等纵向项目6项。

报告题目:非线性随机动态系统的粒子滤波与平滑

报告简介:非线性随机动态系统的状态估计问题广泛存在于诸多工程应用与理论研究领域中。其中,滤波与平滑是最为核心的两个子问题。贝叶斯理论为滤波与平滑提供了统一的理论解决框架,在该框架下,滤波与平滑可归结为一系列后验概率密度函数的递推求解。然而,这些递推公式中涉及到多个复杂高维积分的求解,且这些积分通常无法解析计算。蒙特卡罗抽样(也称为统计模拟)方法是一种强有效的积分近似计算方法,基于该方法可得到估计精度高且适用于强非线性(非高斯)系统的粒子滤波与平滑算法。该报告将针对在目标跟踪、定位、导航、网络控制等实际工程应用中存在的噪声异步相关、模型具有解析子结构、量测多步传输延迟这三类复杂情况,简要介绍如何设计合适的粒子滤波与平滑算法来实现对状态的精准估计。


 

5)报告人:马培荣

  复旦大学2020级全日制博士生,研究方向为计算机视觉、图像处理、机器学习和模式识别,先后在包括《Pattern Recognition》、《IEEE Transactions on Circuits and Systems for Video Technology》和《IEEE Transactions on Image Processing》等国内外期刊和CCF列表会议如AAAI和ICME,以及ICLR发表论文。现为《IEEE Transactions on Circuits and Systems for Video Technology》期刊审稿人。近年来,参与科研项目3项。

报告题目:基于生成模型的零样本学习算法研究

报告摘要:零样本学习是计算机视觉和机器学习中的一个热门研究领域,其目标是识别不提供任何训练样本的新类别,在医疗影像分析、自动驾驶、智能安防监控等领域有着广泛的应用前景。本报告将介绍零样本学习的基本原理及发展现状,并介绍基于生成模型解决零样本学习任务的一些工作。


 

6) 报告人:刘灿

  2023 年北京大学智能学院博士。2018年北京大学理学士、经济学士。研究方向为深度学习驱动的可视化。在可视化领域期刊会议 IEEE TVCG, ACM CHI, IEEE PacificVis 等发表十余篇论文。获 IEEE VIS 最佳海报提名奖,IEEE PacificVis 最佳海报奖、提名奖,ChinaVis 最佳综述奖、最佳论文提名奖。担任IEEE TVCG、ACM CHI、EuroVis等期刊会议审稿人。

报告题目:智能数据可视化。

报告简介:可视化是一种将数据映射为图形辅助用户理解、探索的方法。然而传统的可视化面临着较高的创建门槛、理解门槛、交互门槛,因此阻碍着用户便捷地使用可视化进行数据分析。本报告围绕着创建、理解、交互三个方面,介绍以机器学习方法支持的以自然语言作为交互手段进行可视化的快速构建,基于可视化自动生成描述、标题辅助用户理解数据,以及在可视化之上自动创建自然交互功能。这三个方面结合,构建了以用户为中心、以可视化为媒介的智能数据分析流程。

7. 会议群聊论坛请添加小编微信获取:

小编老师微信

 

珠海市计算机学会

北京师范大学珠海校区数据科学与大数据系

北京师范大学智能工程与教育应用研究中心

2024/7/14

 

 

附件:2024年京师-大湾区数据科学与大数据及人工智能青年学者论坛

 

扫一扫进入官网
发现更多精彩