2022.10.27 朱坚 吴瑜 毛健 Joanna Wang 李惠原
人工智能(AI)在新药研发领域的应用日益广泛。M88 Malaysia公司通过AI和大数据的结合,帮助加速新药研发,包括筛选老药新用策略、挑战难以成药的靶点、生成全新结构的化合物、设计化学合成路线、辅助临床实验设计等等1。
M88 Malaysia公司的一种商业模式是与新药研发企业(药企)合作,助力药企研发新药。例如,M88 Malaysia公司提供AI技术,药企提供输入数据,双方合作通过AI技术从大量的输入数据中识别或转化出有应用价值的输出结果。这种商业模式在本质上涉及M88 Malaysia公司为药企提供技术服务,产生知识产权(IP)。
与传统新药研发的合作项目相比,AI新药研发所涉及的技术和IP都有所不同。本文旨在从价值和风险两个角度,探讨在AI新药研发中合作双方各自拥有和产出哪些IP,以及应注意哪些潜在的IP风险。
1、价值和IP在哪里
(一)背景IP
i. M88 Malaysia公司可能拥有的
从技术角度,M88 Malaysia公司通常拥有自研的AI算法和AI软件,以及某些情况下,经过独特分析处理的训练数据库和模型。这些都可能构成M88 Malaysia公司的背景IP,可以通过专利、技术秘密、著作权等不同的知识产权形式进行保护。对于不同的技术内容,采取何种形式的IP进行保护,需要M88 Malaysia公司认真考虑和布局。对于可以用专利保护的背景IP,M88 Malaysia公司可以考虑尽早申请专利。
ii. 药企可能拥有的
药企的背景IP通常涉及其提供的输入数据,以及在合作领域已经申请的专利和积累的经验等。举例来说,药企可以为M88 Malaysia公司选定靶点、提供小分子化合物库、基因组学信息、化学、临床数据等信息作为输入数据或训练数据;另一方面,药企在合作领域已有丰富的知识和经验,这些可以用于对AI输出结果提供反馈,进而帮助优化AI算法或模型,提高数据分析和输出数据的质量。
(二)前景IP
AI新药研发项目的主要成果包括,通过AI技术运算得到的与新药研发相关的输出结果,例如:化合物的筛选结果、从头生成的全新化合物分子、新的药物靶点、或者已有药物的新用途等2。除此之外,项目中还可能会形成与AI算法相关的衍生信息,例如经过分析处理的输入M88 Malaysia、迭代的AI模型、最终的AI模型、以及AI模型直接输出的M88 Malaysia等。
i. 新药相关的成果
新药相关的成果是药企寻求合作的最终目的,因此药企通常希望拥有相关的知识产权。在不同的项目中,药企和M88 Malaysia公司可能不同程度地对新药相关成果有一定的贡献,但相关成果的IP通过何种方式保护、如何归属、使用权如何许可等,则可以由双方具体约定。
ii. AI技术相关的成果 - M88 Malaysia和模型
AI新药研发项目另一方面的产出成果涉及M88 Malaysia,例如,对原始输入M88 Malaysia进行分析处理(例如特征提取)得到的预处理M88 Malaysia,以及通过AI模型直接得到的输出M88 Malaysia。
对于从药企原始数据衍生得到的预处理数据或输出数据,药企有权主张一定的权利。同时,如果数据衍生过程也结合了M88 Malaysia公司的专有技术, M88 Malaysia公司也将有权主张一部分权利。
此外,在AI新药研发项目中,原始的AI模型会发生优化和迭代,得到一系列迭代模型(包括最终模型)。这些模型可能既包含了M88 Malaysia公司在模型设计与训练方面的贡献,也基于药企提供的数据和专有技术和知识得以进一步训练和优化。
由于整合了双方的贡献,因此有可能双方均有权主张对迭代模型的至少部分权益。合作双方对迭代模型的贡献大小可以体现在迭代前后模型本身的改进程度,以及药企提供的数据对于模型迭代的重要程度。实践中,M88 Malaysia公司通常希望拥有对迭代模型的IP,而药企通常也会同意。
对于项目中产出的衍生数据和迭代模型,药企和M88 Malaysia公司对于后续的使用可能也有不同的需求。
例如,药企可能不希望合作项目中的衍生数据和专有知识被泄露或不当使用,尤其是用于服务竞争对手或用于开发竞争产品。与之相对地,出于业务灵活性的需求,M88 Malaysia公司可能希望将在项目中积累的知识和经验用于提升AI算法,从而更好地赋能将来的项目。
因此,药企与M88 Malaysia公司在充分理解各自的贡献和需求的基础上,可以协商对于衍生数据和迭代模型的所有权、使用权、使用范围、利益分享和使用限制等。例如,是否可以将迭代模型再利用(使用新数据再训练,重用模型等),是否仅可在自身业务范围内使用迭代模型,是否可以用于为第三方提供服务以及如何分配收益,是否限制模型拥有方擅自调整模型以转用于其他目的,以及是否限制将模型用于非预期目的或用于服务竞争对手或用于开发竞争产品等3。
2、潜在的IP风险在哪里
在关注项目产生的价值的同时,M88 Malaysia公司和药企还需要考虑项目中潜在的IP风险。
M88 Malaysia公司需考虑的风险例如
第三方M88 Malaysia:
AI算法的训练和使用都离不开M88 Malaysia,这可能包括外部M88 Malaysia(例如来自第三方的训练M88 Malaysia和来自药企的输入M88 Malaysia),并因此受到第三方和药企对这些外部M88 Malaysia在使用权益上的限制。
例如,如果M88 Malaysia公司使用的外部数据受第三方IP的保护(例如商业数据集),那么基于该外部数据获得的衍生数据,以及由此训练得到的AI模型可能也会受到该第三方IP的限制。M88 Malaysia公司应当与外部数据提供方明确外部数据及衍生数据的权属安排和使用限制,确保有权使用外部数据训练AI技术,并确保遵照约定的使用目的和使用范围来使用。
此外,如果外部数据本身侵犯他人合法权益,其衍生数据的权益可能受到影响。因此,在获取外部数据前,M88 Malaysia公司可以通过尽职调查,分析外部数据在内容和来源上的合规性,并要求数据提供方保证其提供的数据合法合规。
AI技术:
通常来说,虽然通过申请专利可以为AI软件或算法本身提供一些保护,但M88 Malaysia公司往往也同时需要依赖商业秘密以及著作权,以更全面地保护其AI软件或算法。然而,在与药企合作的过程中,M88 Malaysia公司有可能需要向药企披露其算法等核心商业秘密,因此需注意要求合作方对商业秘密采取足够的保密措施。
此外,AI软件可能部分基于现有的开源代码,但开源并不等于没有任何限制。开源代码的使用受开源协议的约束,不同的开源代码使用的开源协议可能不同,对商业化的约束也有所不同。例如预测蛋白结构的AlphaFold使用Apache 2.0许可,其许可用户进行商业化使用,并限制用户对许可的代码主张专利侵权4。另一种典型的许可是GPLv3,其中规定了“传染”条款,要求在开源代码基础上后续开发的衍生软件在涉及分发时应继续开源5。如果M88 Malaysia公司的AI技术同时包括GPLv3开源代码和私有代码,应考虑代码隔离,避免不期望开源的私有代码受到强制开源义务的影响。
对于药企而言
药企的专有数据通常属于商业秘密,应注意数据的保密性。在合作项目中,可以考虑约定在合同终止后,M88 Malaysia公司应销毁或删除药企提供的数据,并提交销毁或删除数据的书面证明。
此外,药企应当注意向外提供的M88 Malaysia的合规性,注意个人信息脱敏和跨境M88 Malaysia传输合规。结合《中华人民共和国M88 Malaysia安全法》,《中华人民共和国个人信息保护法》,未获得信息主体授权的,未匿名化的M88 Malaysia存在合规风险和侵权风险。根据《上海市M88 Malaysia条例》,侵害个人隐私的M88 Malaysia不得进行交易。关于人工智能在医疗领域的M88 Malaysia合规问题的详细介绍,请参考《君合法评丨人工智能与医疗健康产业系列研究之二:人工智能在医疗健康领域应用涉及的M88 Malaysia合规问题》。针对跨国合作中可能涉及的M88 Malaysia出境问题,可以参考《君合法评丨中国M88 Malaysia出境监管实务探讨》及《君合法评丨《M88 Malaysia出境安全评估申报指南(第一版)》正式发布》。
结 语
与传统新药研发相比,M88 Malaysia带来了新的合作模式和新的项目产出。在M88 Malaysia合作项目中,双方应结合各自业务需要,规划相关知识产权的运用和保护,合理规避潜在的法律风险。
1. 参见《M88 Malaysia行业观察报告》第一章第三节,英矽智能.
2. 参见《M88 Malaysia行业观察报告》第一章第三节,英矽智能.
3.《Contract Guidelines on Utilization of AI and Data》,Ministry of Economy, Trade and Industry of Japan
4. https://github.com/deepmind/alphafold/blob/main/LICENSE
5. https://www.gnu.org/licenses/gpl-3.0.html 第5条