产品详细
产品详细当前位置:产品详细

中国科学院 半导体所 高晓梅

《中国科学院半导体所高晓梅》

1956年,在我国十二年科学技术发展远景规划中,半导体科学技术被列为当时国家新技术四大紧急措施之一。为了创建中国半导体科学技术的研究发展基地,国家于1960年9月6日在北京成立中国科学院半导体研究所(以下简称半导体所),开启了中国半导体科学技术的发展之路。
半导体所拥有两个国家级研究中心—国家光电子工艺中心、光电子器件国家工程研究中心;三个国家重点实验室—半导体超晶格国家重点实验室、集成光电子学国家重点联合实验室、表面物理国家重点实验室(半导体所区);两个院级实验室(中心)—半导体材料科学重点实验室、中科院半导体照明研发中心。此外,还设有半导体集成技术工程研究中心、光电子研究发展中心、半导体材料科学中心、高速电路与神经网络实验室、纳米光电子实验室、光电系统实验室、全固态光源实验室和半导体能源研究发展中心。并成立了图书信息中心,为研究所提供科研支撑服务。
半导体研究所现有职工640余名,其中科技人员460余名,中国科学院院士8名,中国工程院院士2名,正副研究员及高级工程技术人员198名,“百人计划”入选者及国家“杰青”获得者35名、国家百千万人才工程入选者6名。其中黄昆先生荣获2001年度国家最高科学技术奖。设有5个硕士学位授予点,3个工程硕士培养点,4个博士学位授予点,3个博士后流动站。
半导体所高度重视国内外交流合作,与地方政府、科研机构、大学和企业等共建了1个院士工作站、3个研发(转移)中心、9个联合实验室,积极为企业和区域经济社会发展服务。同时积极开展多层次、全方位的国际学术交流与合作,成绩显著,科学技术部和国家外国专家局批准成立“国家级国际联合研究中心”。并且以自主知识产权的专利和专有技术投资,融合社会资本建立了10余家高技术企业,并实施科研成果转化为现实生产力,已初步形成产业化、商品化规模。
半导体所秉承“以人为本、创新跨越、唯真求实、和谐发展”的办所理念,奋斗不息,勇攀高峰,取得了快速发展,研究所已逐渐发展成为集半导体物理、材料、器件研究及其系统集成应用于一体的国家级半导体科学技术的综合性研究机构。
半导体所的中长期发展战略目标是:开展与国家发展密切相关的、世界科技前沿的基础性、前瞻性、战略性科技创新活动,为发展我国的高新技术提供源源不断的动力;以国家战略需求为导向,开展战略高技术研究,为国民经济和国防建设提供科技支撑,并为相关行业的技术进步作出贡献;吸引、聚集和培养国际一流人才;建立具有国际先进水平的、开放的实验研究和测试平台,实现科技创新能力的跨越和持续发展,成为引领我国半导体科学技术发展的火车头。

中科院半导体所论文再登TNNLS顶刊,贡献探索数学表达式的新视角

超神经HyperAI

2024-02-0111:01:21发布于福建

+关注

*预测的困难程度会随着预测对象数量的增加而增加,同时表达式的隐藏层(即复杂度)也会增加;

*标签预测的瓶颈在于操作员的选择;

*DSN2比DSN1更好地求解了最优和近似解;

*等效标签合并和样本平衡可以增强算法算法的鲁棒性。

首先,DeepSymNet比符号树能更有效地表示表达式,对于在一个表达式中多次出现的同一模块,DeepSymNet的平均标签长度比NeSymRes短。



使用DeepSymNet标签训练的模型的预测准确率远超使用NeSymReS标签训练的模型,如上图所示。这说明DeepSymNet标签优于符号树标签。


其次,随着表达式所占隐层数的增加,该模型的预测准确率迅速下降。所以,研究团队提出标签预测可以分为两个子任务——算子预测和连接关系预测,以确保标签预测问题能够得到更好的解决。



将DeepSymNet分为两部分进行训练的结果表明,随着隐层数的增加,算子选择的预测精度急剧下降,而连接关系的预测精度一直很高。这是由于算子选择空间要比连接关系选择空间大的多。所以,为了提高算子选择的准确性,研究人员对算子选择进行了单独训练。



在预测过程中,团队首先使用算子选择模型获得算子选择序列,然后将其输入到训练后的模型DSN1中预测连接关系,测试结果如上图。在对运算符选择进行单独训练后,预测精度大大提升。单独训练的模型称为DSN2。


此外,研究人员还进行了验证等效标签合并和样本平衡增强鲁棒性的消融实验。首先随机抽取了50万个训练样本,其中包含128,455个不同的标签(TrainDataOrg)。结果发现这些标签的样本数分布严重不均,最小样本数为1,最大样本数为13,196,样本数方差为13,012.29。



随后团队对样本数进行了平衡,分别获得训练样本TrainDataB,以及合并等效标签后获得的训练样本TrainDataBM。


随后基于3个训练数据得到模型DSNOrg、DSNB和DSNBM,这3个模型在测试集上进行了测试,三者从前至后准确率依次提升,说明增加样本平衡和合并等效标签后,模型求解最优解的准确率得到了提高,确实增强了算法的鲁棒性,提高了算法的性能。


公共数据集测试结果


研究团队使用了6个测试数据集:Koza、Korns、Keijzer、Vlad、ODE和AIFeynman,从这些数据集中选取了不超过3个变量的表达式进行测试。与目前流行的基于监督学习的方法比较显示,该算法(DSN1、DSN2)的准确性优于对比算法。



此外,团队将该算法与当前流行的基于搜索的方法EQL、GP和DSR进行比较,得到结果如下图所示。



该算法(DSN1、DSN2)的平均误差最小,得到的表达式的复杂度也最接近真实表达式的复杂度。


综上,根据结果可以得出结论,该团队研究的算法在符号表达式误差、符号表达式复杂度和运行速度3个方面都优于对比算法,证实了该算法的有效性。

背后团队星光熠熠关于符号回归的核心问题,全世界的科学家都在不断努力。尽管在论文中提到,DeepSymNet仍有一些局限性,但这项研究仍旧为人工智能解决数学问题做出重要贡献,通过将其视为分类问题的方法,无疑为基于监督学习的SR方法提供了一个全新的解题思路。


当然,取得这一成就的背后还离不开一群人的热血和汗水,比如论文的第一作者吴敏,从中科院半导体所官网查询,吴敏现为中国科学院半导体研究所助理研究员,参与了「基于深度学习的符号回归及其在半导体器件研发中的应用」、「知识融合的神经网络分治约简符号回归方法」等多个科研项目。


另外,论文作者中的刘婧逸博士,在去年7月以第一作者的身份,被人工智能顶刊NeuralNetworks收录了一篇论文,论文题为《SNR:SymbolicNetwork-basedRectifiableLearningFrameworkforSymbolicRegression》,为符号回归问题提供了一种具有纠正能力的学习框架。


从相关课题的研究来看,国内正在扎扎实实地引领创新性的方法,未来可期的是,这些理论和研究成果必将在不久的将来对于解决实际问题贡献重要意义。

Copyright2023未知推广科技