In recent years, recommender systems have advanced rapidly, where embedding learning for users and items plays a critical role. A standard method learns a unique embedding vector for each user and item. However, such a method has two important limitations in real-world applications: (1) it is hard to learn embeddings that generalize well for users and items that have rare interactions, and (2) it may incur unbearably high memory costs when the number of users and items scales up. Existing approaches either can only address one of the limitations or have flawed overall performances. In this article, we propose Clustered Embedding Learning (CEL) as an integrated solution to these two problems. CEL is a plug-and-play embedding learning framework that can be combined with any differentiable feature interaction model. It is capable of achieving improved performance, especially for cold users and items, with reduced memory cost. CEL enables automatic and dynamic clustering of users and items in a top-down fashion, where clustered entities could jointly learn a shared embedding. The accelerated version of CEL has an optimal time complexity, which supports efficient online updates. Theoretically, we prove the identifiability and the existence of a unique optimal number of clusters for CEL in the context of nonnegative matrix factorization. Empirically, we validate the effectiveness of CEL on three public datasets and one business dataset, showing its consistently superior performance against state-of-the-art methods. In particular, when incorporating CEL into the business model, it brings an improvement of

\(+0.6\%\)

in AUC, which translates into a significant revenue gain; meanwhile, the size of the embedding table gets 2,650 times smaller. Additionally, we demonstrate that if there is enough memory, learning a personalized embedding for each user and item around their clustering centers is feasible and can further boost performance. In this article, we enhance and extend the personalization technique we initially proposed in our earlier work [ 4 ], which introduced an offset regularization to prevent personalized embeddings from drifting too far away from the central (cluster) embedding, thereby mitigating overfitting. However, in [ 4 ], we simply applied a uniform regularization weight across all embeddings, which, given the considerable variation in the number of their associated interactions, is suboptimal. To address this, we investigate in this article the strategies for non-uniform offset regularization that adjusts regularization weights according to the number of associated interactions, which leads to significant improvements compared with uniform offset regularization. Furthermore, we extend CEL into Meta-CEL, factoring in future personalization during cluster optimization, which leads to additional enhancements in personalization performance.

2025-05-28·Emerging Markets Finance and Trade

Labor Protection and Capital Structure of SMEs: Evidence from China’s Social Insurance Law

作者: Zhao, Xiliang ; Lin, Wei ; Yu, Jingyi ; Xu, Yan ; Li, Jianqiang

2025-05-12·Journal of Environmental Planning and Management

Digitization and green innovation: how does digitization affect enterprises’ green technology innovation?

作者: Xu, Qiong ; Li, Xin ; Dong, Yu ; Guo, Fei

项与上海财经大学相关的新闻（医药）

2024-12-25

·药物分子设计

稳定学习预后标志物，多种癌症生存曲线证实！清华最新成果登Nature顶级子刊

第一性原理计算解决50年悬而未决难题：半导体中铜为何扩散更快？ Ab initio及第一性原理入门参考书介绍《海贼王》告诉你，做科研为什么不能闭门造车…… 来自公众号：新智元本文以传播知识为目的，如有侵权请后台联系我们，我们将在第一时间删除。新智元报道编辑：LRST 【新智元导读】清华大学与国家蛋白质科学中心的最新成果，结合了稳定学习的理论，提出了一个面向多中心、大队列异质数据的「稳定」生存分析方法。近日，清华大学与国家蛋白质科学中心联合提出了一种发现稳定标志物（Biomarker）的Stable Cox模型，并在多种癌症的组学以及临床预后数据上证明—— Stable Cox可以发现在多个测试中心数据上稳定的预后标志物，该标志物可以用于对病人进行亚型分层以及生存曲线预测。目前，这项研究成果已经登上了全球顶级期刊Nature Machine Intelligence。论文链接：https://www.nature.com/articles/s42256-024-00932-5 预后标志物是一种能够提供有关疾病未来发展、结果或者患者生存情况等信息的生物标志物。可以是生物分子（如蛋白质、核酸等）、细胞特征（如特定细胞类型的存在或数量变化）或者影像学特征等多种形式。通过检测和分析这些标志物，可以帮助医生预测疾病的进程、患者对治疗的反应、复发的可能性以及总体生存时间等重要预后信息。该工作是崔鹏团队所提出的stable learning (稳定学习) 的理论和方法在生存分析领域的最新力作。受因果推理方法启发，稳定学习方法专注于学习协变量和输出之间的稳定因果关系，而非易变的相关性 [3]。受益于因果分析方法提供的理论保证，稳定学习方法在分布偏移场景下通常具有很强的泛化性、可解释性和公平性 [4]。然而，稳定学习方法还无法用于复杂的「time-to-event」数据，该论文从方法到理论介绍如何将稳定学习用于提高生存分析模型的泛化性。生存分析中多中心异质数据的泛化难题生存分析是一个重要的统计研究方向，评估协变量对感兴趣事件发生时间的影响，广泛应用于医学、公共卫生、工程、金融等关键领域，以帮助决策和预测生存结果，识别影响生存的关键因素。 Cox风险比例模型（Cox Proportional Hazards Model）[5]，又称Cox回归模型，由英国统计学家David Cox于1972年提出。该模型以生存结局和生存时间为因变量，可同时分析众多因素对生存期的影响，能分析带有截尾生存时间的数据，且不要求估计数据的生存分布类型。因上述优点，Cox回归模型迅速成为生存分析中最常用和最重要的工具之一，广泛应用于医学、公共卫生、流行病学、临床试验等多个领域。以Cox模型为主流的大多数现有生存分析方法假设训练和测试数据具有相似的分布，而在现实中，由于不同中心或人群队列的异质性、不同仪器甚至不同分析方法等因素，这一假设常常并不成立，对现有生存分析方法的泛化性和可靠性提出了严峻的挑战，尤其是在个性化医疗和药物研发等高风险应用中，模型的可靠性超越了简单的统计考量，成为生死攸关的重要问题。生存分析的分布外泛化场景应对多中心异质数据分布偏移的主要挑战是「如何找到稳定的生物标志物」，由于生存分析数据是复杂的「time-to-event」数据并且其本质是相关性驱动的学习机制，因此导致现有方法会盲目的学习到训练集中存在的虚假相关性（比如，病人某个基因的表达和他所在地点高度相关，然后该地点的医疗水平又会影响该病人的预后）。然而，这种虚假相关性是不稳定的，是容易在测试中心数据上发生改变的，导致我们训练好的生存模型在用到新的测试中心时有显著的风险。如何找到生存分析的稳定变量是困扰学界多年来的问题，也是将该类方法用到生命科学等关键领域的重要瓶颈。 Stable Cox:稳定生存分析方法为了使得生存分析方法不受虚假相关影响识别稳定标志物，该研究提出发现稳定的预后标志物的关键是在于消除不稳定协变量与生存结果之间的虚假相关性，从而使得学习到的相关性可以代表协变量对生存概率的因果影响，这个因果影响在不同测试中心是稳定的。具体而言，该模型由两阶段组成：「独立性驱动的样本加权」和「加权Cox回归」。 Stable Cox模型框架在独立性驱动的样本加权阶段，学习一套样本权重对样本进行重加权使得协变量之间相互独立；在加权的Cox回归阶段，Cox模型损失中的样本被我们之前学到的样本权重进行重加权。这个加权后的样本损失可以有效地分离每个变量对于生存输出的效应。从理论上，可以证明即使在有模型错估的情况下，Stable Cox模型可以识别稳定变量进行预测，也就是模型在不稳定变量上的系数为0。研究团队在三类癌症组学数据集（肝癌、乳腺癌、黑色素瘤）和两类癌症临床生存数据（肺癌、乳腺癌）上进行了广泛实验，采用多个独立测试群体和子群体，展示了此方法的强大泛化能力（平均提升6.5%-13.9%）。此外，Stable Cox学习得出的权重系数可用于发现潜在的组合标志物，并区分生存风险显著不同的亚型，这对于指导治疗决策和靶向药物研发具有重要意义。在肝癌、乳腺癌、⿊⾊素瘤上Stable Cox与其他方法在多个独立测试集上的C-index比较 Stable Cox的预后亚型人群分组结果，以及标志物在不同中心预后一致性统计在肺癌、乳腺癌临床指标上Stable Cox与其他方法在多个人群、独立测试集上的C-index比较，以及预后亚型人群分组结果和top10标志物分析结论从队列的回顾性研究中发现稳定的标志物用于前瞻性研究是机器学习方法用于实际医疗场景中的关键和难题。然而，现有标志物识别技术的泛化能力较差，仅在与训练数据相似的患者样本中有效，无法应用于多样化的开放环境样本。这些问题使得传统技术发现的标志物难以通过前瞻性测试，不仅导致研发资源的巨大浪费，还阻碍了医药领域的进一步发展，迫切需要开发能够在异质性数据中精确识别并具有高泛化能力的生物标志物的新技术，以实现疾病的早期准确诊断，满足社会对健康保障的需求。这项研究提出的稳定生存分析方法旨在通过变量独立使得发现稳定预后标志物成为可能，同时该研究也将呼唤研究界重视机器学习方法在医疗等关键领域应用的稳定性和可靠性。本文通讯作者清华大学崔鹏副教授、国家蛋白质科学中心常乘副研究员。共同第一作者分别是清华范少华博士、徐韧喆博士（目前是上海财经大学助理教授），国家蛋白质科学中心（北京）博士研究生董乾。其他作者还包括清华何玥博士。该工作得到了人体蛋白质组导航（π-HuB）国际大科学计划的支持。参考资料： https://www.nature.com/articles/s42256-024-00932-5

专利侵权

2024-12-21

·智药邦

Nat Mach Intell｜国家蛋白质科学中心贺福初/常乘团队等合作研发多中心、大队列“稳定”预后标志物筛选模型

生存分析是一个重要的统计研究方向，评估协变量对感兴趣事件发生时间的影响，广泛应用于医学、公共卫生、工程、金融等关键领域，以帮助决策和预测生存结果，识别影响生存的关键因素。Cox风险比例模型（Cox Proportional Hazards Model），又称Cox回归模型，由英国统计学家David Cox于1972年提出。该模型以生存结局和生存时间为因变量，可同时分析众多因素对生存期的影响，能分析带有截尾生存时间的资料，且不要求估计资料的生存分布类型。因上述优点，Cox回归模型迅速成为生存分析中最常用和最重要的工具之一，广泛应用于医学、公共卫生、流行病学、临床试验等多个领域。以Cox模型为主流的大多数现有生存分析方法假设训练和测试数据具有相似的分布，而在现实中，由于不同中心或人群队列的异质性、不同仪器甚至不同分析方法等因素，这一假设常常并不成立。这对现有生存分析方法的泛化性和可靠性提出了严峻的挑战，尤其是在个性化医疗和药物研发等高风险应用中，这些模型的可靠性超越了简单的统计考量，成为生死攸关的重要问题。图示：生存分析的分布外泛化场景为了应对该挑战，清华大学的崔鹏团队与国家蛋白质中心（北京）贺福初/常乘团队共同提出了一种发现稳定标志物的Stable Cox模型。该研究以“Stable Cox Regression for Survival Analysis under Distribution Shifts”为题，于2024年12月13日发布在Nature Machine Intelligence。在多种癌症的组学以及临床预后数据上证明了Stable Cox可以发现在多个测试中心数据上稳定的预后标志物，该标志物可以用于对病人进行亚型分层以及生存曲线预测。该研究提出发现稳定的预后标志物的关键是在于消除不稳定协变量与生存结果之间的虚假相关性，从而使得学习到的相关性可以代表协变量对生存概率的因果影响，这个因果影响在不同测试中心是稳定的。该研究为方法的稳定性和一致性提供了理论保证，保证其可以消除不稳定协变量的影响。具体而言，该模型由两阶段组成：独立性驱动的样本加权和加权Cox回归。在独立性驱动的样本加权阶段，模型学习一套样本权重对样本进行重加权使得协变量之间相互独立。在加权的Cox回归阶段，Cox模型损失中的样本被之前学到的样本权重进行重加权。这个加权后的样本损失可以有效地分离每个变量对于生存输出的效应。从理论上可以证明即使在有模型错估的情况下，Stable Cox模型可以识别稳定变量进行预测，也就是模型在不稳定变量上的系数为0。图示：Stable Cox模型框架。研究团队在三类癌症组学数据集（肝癌、乳腺癌、黑色素瘤）和两类癌症临床生存数据（肺癌、乳腺癌）上进行了广泛实验，采用多个独立测试群体和子群体，展示了此方法的强大泛化能力（平均提升6.5%-13.9%）。此外，Stable Cox学习得出的权重系数可用于发现潜在的组合标志物，并区分生存风险显著不同的亚型，这对于指导治疗决策和靶向药物研发具有重要意义。图示：在肝癌、乳腺癌、⿊⾊素瘤上Stable Cox与其他方法在多个独立测试集上的C-index比较。图示：在肺癌、乳腺癌临床指标上Stable Cox与其他方法在多个人群、独立测试集上的C-index比较，以及预后亚型人群分组结果和top10标志物分析。结论： 1.从队列的回顾性研究中发现稳定的标志物用于前瞻性研究是机器学习方法用于实际医疗场景中的关键和难题。 2.然而，现有标志物识别技术的泛化能力较差，仅在与训练数据相似的患者样本中有效，无法应用于多样化的开放环境样本。 3.这些问题使得传统技术发现的标志物难以通过前瞻性测试，不仅导致研发资源的巨大浪费，还阻碍了医药领域的进一步发展。 4.迫切需要开发能够在异质性数据中精确识别并具有高泛化能力的生物标志物的新技术，以实现疾病的早期准确诊断，满足社会对健康保障的需求。 5.本研究提出的稳定生存分析方法旨在通过变量独立使得发现稳定预后标志物成为可能，同时该研究也将呼唤研究界重视机器学习方法在医疗等关键领域应用的稳定性和可靠性。本文共同通讯作者是崔鹏博士和常乘博士，共同第一作者是清华范少华博士、徐韧喆博士（现为上海财经大学助理教授）、国家蛋白质科学中心（北京）博士研究生董乾。该工作得到了人体蛋白质组导航（π-HuB）国际大科学计划的支持。原文链接: https://www.nature.com/articles/s42256-024-00932-5 本文转自【人体蛋白质组导航计划】公众号 --------- End --------- 感兴趣的读者，可以添加小邦微信加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位或姓名-学校-职务/研究方向。

2024-07-16

·蒲公英Ouryao

蒲公英教育受邀参加上海产教融合型城市建设工作推进会

7月15日上午，以“共建产教融合生态共创新质发展未来”为主题的“上海产教融合型城市建设工作推进会暨临港新片区产教融合发展大会”在临港中心成功举办。市委常委、临港新片区党工委书记、管委会主任陈金山，副市长解冬出席活动。大会现场，临港新片区产教融合创新联盟正式启动。该联盟将发挥需求联动联通，资源共建共享的作用，构建覆盖行业企业、高等院校、科研机构、功能性平台、行业协会的全方位体系，全力打造产教融合创新发展的“朋友圈”和“生态圈”。陈金山在大会致辞中表示，深化产教融合工作是国家推动教育优先发展、人才引领发展、产业创新发展的战略性举措，也是上海建立现代化产业体系、深化“五个中心”建设的重要引擎。临港新片区始终把产教融合作为产业高质量发展、高校高水平建设、人才高标准培养的重要路径，持续打造更加“创新、多元、开放”的产教融合体系。作为上海建设国家产教融合试点城市的核心区域，现在的临港比以往任何时候，都更加需要人才供给和产业需求的精准对接，都更加需要人才链、产业链、创新链之间的有机融合，都更加需要产教融合的双向奔赴。临港新片区第二批产教融合示范基地及第三批产教融合培育基地授牌。产教融合基地已成为建设临港产教示范样板、推进产教协同育人、创新产教培育模式的重要载体。生物医药领域：上海蒲公英时代教育科技有限公司（简称“蒲公英教育”）被授予临港新片区产教融合培育基地荣誉牌匾，上海海洋大学被授予临港新片区产教融合示范基地荣誉牌匾。建设高能级产教融合培育基地和示范基地是临港新片区加快建设国家产教融合试点城市，落实《临港新片区国家产教融合试点核心区建设方案》《临港新片区关于支持产教融合发展的若干政策意见》《支持临港新片区加大先行先试探索深化产教融合城市建设若干措施》等要求的重要举措之一。会上，上海市产教融合型城市建设促进中心正式揭牌，标志着上海产教融合的推进机制更加完善、各项工作更加深入。在相关部门的指导支持下，中心将搭建链接产教各主体的服务平台，协助推动各项产教融合政策举措落地。大会启动了临港新片区11个重点产业校企实践基地，包括上海海洋大学和蒲公英教育、西北工业大学和上飞制造、西安交通大学和中国航发商发、成都电子科技大学和芯原科技、华东理工大学和臻格生物等。大会发布了临港新片区车载软件与汽车联合实验室、PKU-WLA-ATLATL滴水湖公共实验平台、水下无人智能装备科技转化平台等重点产教融合项目15个，将为重点产业培养和输送更多高素质的应用型、创新型人才，推动教育模式的改革，实现教育资源与经济发展的紧密结合。会上，《上海市产教融合型企业建设培育政策指引》正式发布。该《培育指引》将帮助企业进一步了解和深入参与产教融合。在区域端，以临港新片区为核心区，深化产教融合生态建设，引领带动全市各重点区域改革创新，形成1+N的区域发展格局。活动现场介绍了临港新片区产教融合试点城市建设情况，并发布了支持产教融合发展若干政策的2.0版本。四年来，临港新片区管委会共支持了120个产教融合项目，累计拨付产教融合扶持资金1.52亿元。《2.0版政策》对于示范基地重要载体建设新建项目和改扩建项目，将按照最高总投资（不含土地成本）20%的资金予以支持，最高分别为2000万元和1000万元。对于创新性、影响力突出，示范效应明显的产教合作项目将按照最高总投资50%的资金予以支持，最高金额500万元。对于相关重大项目，将支持其提升土地容积率、增加地下用地空间，推荐其享受临港新片区相关贷款贴息政策。作为产教融合领域的杰出践行者，上海交通大学常务副校长奚立峰、积塔半导体首席执行官周华博士，以及临港集团产教融合发展中心主任、上海临港产教融合促进中心理事长韩国华，分别发表了精彩纷呈的演讲，他们从各自独特的视角深入剖析了产教融合的实践路径与深远影响。国家发改委社会发展司副司长赵俊强，市政府副秘书长王平，市政府副秘书长、市发改委党组书记、主任顾军，市教卫工作党委副书记、市教委主任周亚明，上海交通大学常务副校长奚立峰，市发改委副主任陈石燕，市科委副主任黄红，市国资委副主任陈东，上海海洋大学党委书记王宏舟，上海电力大学校长顾春华，上海海事大学校长初北平，上海电机学院院长龚思怡，临港新片区党工委委员、管委会专职副主任苗挺、唐浩，国家发改委，市发改委、市教委、市经信委、市科委、市财政局、市人社局、市国资委，临港新片区管委会相关处室，北京大学、北京理工大学、西北工业大学、复旦大学、上海交通大学、华东师范大学、上海财经大学等重点高校，新片区各开发主体、园区平台公司、功能平台、服务机构、科研院所等功能性机构代表，重点行业代表企业、媒体代表等260余人参会。编辑：邱晓慧转自：上海临港关于【蒲公英教育】蒲公英教育，是蒲公英旗下专注于制药产业链综合教育的专业板块。管理团队均为制药行业年资超15年的制药人。总部位于上海，已为超200家业内企业提供专业知识产品及服务。蒲公英教育的专业师资及授课人群，覆盖药审、院校、药企、供应链、园区等。业务涵盖线上、线下课程（培训/实操/认证/沙龙）、内训内审、咨询验证、培训软件、书籍出版、赛事活动（峰会/辩论赛/知识竞赛/技能比武）七大板块。蒲公英教育课程体系，覆盖中药、化药、生物药，从研发到产业化，每年开课超100节，参与人数超10000人，线下课程全国巡回，部分省市药监检查员及知名制药企业均使用蒲公英教育的课程及培训系统，会员单位超100家。蒲公英教育实训基地，位于上海临港生命蓝湾，面积1000㎡，涵盖生物医药通用品种生产、实验室、通用系统的洁净车间及模拟产线，用于制药实操课程培训。蒲公英教育出版的专业书籍，包括《全球制药术语英汉双解词典》和《FDA警告信回顾与案例解读（2022版）》（中国医药科技出版社），已作为众多业内企业的专业工具书及培训用书。蒲公英教育，助力每一位制药人的专业提升和职业发展！联系咨询：李老师，13917280549（微信注明：蒲公英教育）邮箱：edu@ouryao.com 蒲公英教育推荐阅读临港产业大学生物医药学院数字化专业分院成立官宣｜临港产业大学生物医药学院抗体药物专业分院官宣｜临港产业大学生物医药学院微生物专业分院

100 项与上海财经大学相关的药物交易

登录后查看更多信息

100 项与上海财经大学相关的转化医学

登录后查看更多信息