4月2日,国家互联网信息办公室公布最新的生成式人工智能备案信息。截至2024年3月,我国共有117个GenAI完成了备案,包括文心一言、通义千问、kimi、智谱清言、云雀、abab、日日新、星火、盘古以及最新的滴滴出行大模型等。
1、百度-文心一言
作为科技大厂中首个发布的生成式AI产品,百度“文心一言”于2023年3月16日开启邀测。同年10月,百度发布文心一言最新迭代产品——文心一言4.0。11月1日,百度上线文心一言专业版,单月购买定价为59.9元/月,连续包月优惠价49.9元/月。此前已经向用户开放的文心一言基础版,仍可免费使用。百度CEO李彦宏评价说,文心大模型4.0是迄今为止最强大的文心大模型,实现了基础模型的全面升级,综合能力“与GPT-4相比毫不逊色”。
2、智谱AI-智谱清言
成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。基于ChatGLM,智谱已于2023年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。
3、抖音-云雀
2023年8月17日,抖音集团(前字节跳动)宣布开始对外测试AI对话产品“豆包”。据称,“豆包”是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页Web平台,iOS以及安卓平台,但iOS需要使用TestFlight安装。
4、百川智能-百川
百川智能成立于2023年,由搜狗创始人王小川创立。经过半年多时间发展,百川智能便接连发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会发布一款新的大模型。百川智能透露,Baichuan-7B/13B两款开源大模型在多个权威评测榜单均名列前茅,累计下载量超过六百万次。Baichuan2-13B在MMLU、CMMLU、MedQA、USMLE等几大权威评估基准中领先LLaMA2。
5、中科院自动化研究所-紫东太初
中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。目前,“紫东太初”参数已达千亿级别,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布2.0版本,再加入了视频、传感信号、3D点云等新的模态数据。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。
6、Minimax-ABAB
Minimax自研了文本到视觉(text-to-visual)、文本到语音(text-to-audio)、文本到文本(text-to-text)三个模态的基础模型架构,推出自研通用大模型“ABAB”。
7、商汤科技-日日新
2023年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,其参数达千亿级规模。
8、上海人工智能实验室-书生
自2021年发布后,“书生”(INTERN)大模型历经数次升级,从国内首个覆盖多种视觉任务的通用大模型,逐步升级为涵括视觉、语言和三维等在内的大模型体系。除书生·天际外,书生还推出了书生·多模态、书生·浦语,并且提供了首个面向大模型研发与应用的全链条开源体系。
9、科大讯飞-星火认知大模型
科大讯飞推出的星火认知大模型是一款新一代的认知智能大模型,它具备跨领域的知识和语言理解能力。这款大模型能够通过自然对话的方式来理解并执行任务,提供了包括语言理解、知识问答、逻辑推理、解答数学题、代码理解与编写等多种能力
10、三六零-360智脑大模型
360智脑大模型是由360集团开发的认知型通用大模型,最新版本为“360智脑4.0”。这款大模型已经接入了360集团旗下的各种产品中。360智脑大模型旨在提供优秀的文本生成和创作服务,支持文本或图片输入生成高质量、多风格的图像。此外,它还具备强大的智能编辑功能,能够轻松实现无损放大、智能消除和智能抠图等,帮助用户快速创作出精美的图片。
11、阿里巴巴-通义千问大模型
通义千问是阿里云自研的底层通用大模型,旨在理解和生成人类语言,成为用户在生活和工作中的智能助手。该模型自4月份正式亮相以来,已经推出了2.0版本,参数达到了千亿级别,强化了其在多个领域的应用能力。在最新的云栖大会上,阿里云宣布通义千问2.0的发布,并同时在各大手机应用市场上线了通义千问APP,进一步扩展了其应用范围。
12、腾讯-腾讯混元助手大模型
腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
13、华为-华为云盘古NLP大模型
华为云的盘古NLP大模型是业界首个超千亿参数的中文预训练大模型,包含在华为云盘古系列超大规模预训练模型中。该模型结合了海量的图像、视频数据和盘古独特技术,构建了视觉基础模型、多模态大模型以及预测大模型,能够实现图像生成、理解、视频生成等功能。它通过融合语言和视觉的跨模态信息,加强了模型的多任务能力,使得不同任务间具备强大的迁移能力。
此外,华为云在4月25日发布了包括30亿参数的全球最大视觉预训练模型和与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言预训练模型。这些模型的开发标志着华为云在工业化AI开发新模式方面的新进展,旨在提升AI的应用效率和效果。
14、华为-智慧助手(小艺)大模型
华为的智慧助手小艺升级版是基于华为盘古L0基座大模型构建的,专门针对终端消费者场景进行了大量的场景数据与精调模型后的L1层对话模型优化。这个全新版本的小艺在华为开发者大会上正式亮相,展示了其更加聪明、能干和贴心的特点。小艺现在能提供更智能的交互体验,例如,根据用户需求自动生成文案等内容。
15、出门问问-序列猴子
出门问问近期发布了自研的大型语言模型「序列猴子」,并在其“AGI·降临”2023 AIGC战略发布会上正式亮相。这款大模型的开发旨在主要服务B端企业,为企业提供专属的模型服务。序列猴子支持智能多轮对话,能够帮助提高对话管理和调度能力,快速响应用户反馈和需求,提高对话的效率和精准度。
这款大模型是一个超大规模语言模型,具有长序列、多模态、单模型、大数据等特点。基于其通用的表示与推理能力,序列猴子支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。
16、月之暗面-Moonshot
月之暗面 (Moonshot AI) 创立于2023年3月,致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能,2023年10月推出全球首个支持输入20万汉字的智能助手产品Kimi。创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。
17、昆仑万维-“天工”大模型
昆仑万维的天工大模型是国内首个对标ChatGPT的双千亿级大语言模型,也是一个对话式AI助手。天工通过自然语言与用户进行问答交互,AI生成能力可满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。支持1万字以上文本对话,实现20轮次以上用户交互,在学习、职场、生活等多类问答场景中表现出色。
18、金山-WPS AI
北京金山软件有限公司推出的WPS AI是一个集成在WPS Office套件中的人工智能应用,旨在为用户提供更智能、高效的文档处理解决方案。它利用大语言模型能力,支持智能文档写作、阅读理解和问答、智能人机交互等功能,以此来提升用户在办公、写作、文档处理等方面的体验。WPS AI将与WPS的其他产品无缝衔接,使用户能够在一个统一的平台上享受到AI增强的办公工具。
此外,WPS AI不仅仅是一个简单的办公助手,它还是一个内容创作工具,能够帮助用户节省时间和精力。通过WPS AI,用户可以改进内容、根据需要修改内容,并利用其内置工具享受到AI带来的种种好处。
19、奇虎-奇元大模型
北京奇虎360科技有限公司近日发布了奇元大模型,这是360公司自研的又一大型模型。奇元大模型已于11月4日通过备案,并且360公司因此成为国内首家两个大模型(包括此前的360智脑大模型)均通过备案的科技企业。奇元大模型的商业化和产品定位主要面向B端用户,预计将聚焦更多商业化应用。
据了解,奇元大模型的技术优势在于360长期深耕的人工智能核心技术,其数据优势基于搜索所拥有的大规模、多样性和高质量训练语料。这为奇元大模型提供了搜索增强的优势,使其在提供生成创作、多轮对话、逻辑推理等核心能力方面表现出色,能够覆盖大模型的全部应用场景。
20、面壁智能-面壁露卡LUCA
面壁智能发布的面壁露卡LUCA是一个千亿多模态大模型,于2023年8月28日在“通用人工智能算力论坛”(AGICF)上重磅发布。这款大模型是基于CPM-Bee作为基座模型,对标ChatGPT的多模态智能对话助手。面壁露卡LUCA 1.0版本最早于5月27日在2023数博会上首次亮相,展示了其语言模型的强大能力。LUCA通过自然语言处理技术,能够实现智能多轮对话,提高对话管理和调度的效率和精准度,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域 。
21、三快-美团大模型“通慧”
22、网易有道-子曰
网易有道推出了教育行业的大模型「子曰」,这是国内首个专注于教育领域的垂直大模型。于2023年7月26日,网易有道在“powered by 子曰”教育大模型应用成果发布会上宣布了这一重大成就。「子曰」大模型发布了六大创新应用,包括“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”,旨在通过AI技术提升教育质量和效率。
23、世纪好未来教育-好未来MathGPT大模型
好未来推出的MathGPT大模型是面向全球数学爱好者和科研机构的数学垂直领域大模型,特别注重解题和讲题算法。这是国内首个专为数学领域打造的大模型,覆盖了中小学数学题的多个类型,如计算题、应用题和代数题等。
24、智者天下-知海图AI
知乎和面壁科技合作推出的「知海图AI」是一个中文大模型,已于2023年4月14日开始内测。据介绍,在特定场景中,「知海图AI」的性能与GPT-4相当。这标志着知乎在人工智能领域的又一大步进展,旨在通过强大的AI能力提升用户体验和内容质量。知乎通过这种合作,进一步扩展了其在AI技术应用上的探索和实践,特别是在处理和理解中文内容方面。
25、蚂蚁金服-AntGLM
蚂蚁集团发布了工业级金融大模型AntFinGLM,并开放了金融专属任务评测集「Fin-Eval」。这个大模型通过综合评估金融专属任务的能力,展现了在金融领域的专业力、知识力、语言力以及安全力,能够在诸如「研判观点提取」、「金融意图理解」和「金融事件推理」等任务上达到专家水平。
26、极目未来-银河大模型
27、维沃移动-vivo蓝心大模型
vivo推出了自研的通用AI大模型矩阵——蓝心大模型,旨在全面提升智能手机的应用和服务能力。蓝心大模型包含了不同参数量级的模型,涵盖了十亿、百亿、千亿三个参数量级,共计五款模型。这些模型旨在满足不同应用需求和算力条件,通过在手机终端和云端的协同工作,以优化性能和用户体验。
28、网易-网易邮箱智能助手大模型
网易邮箱智能助手是网易邮箱团队开发的一款基于大语言模型技术的应用,旨在提高用户处理邮件的效率和体验。这款智能助手已正式通过相关备案,对公众开放。
29、元象-元象XVERSE大模型
元象科技推出的XVERSE大模型系列,包括XVERSE-Long-256K和XVERSE-65B,展示了在人工智能大模型领域的领先技术和创新应用。XVERSE-Long-256K是全球首个上下文窗口长度达到256K的开源大模型,支持输入高达25万汉字,开创了大模型应用的“长文本时代”。该模型通过技术创新,实现了无损长程注意力机制,有效平衡了长文本下的关注内容准确性和推理速度,并且免费开源供商用。
30、朗玛-39AI全科医生
朗玛信息技术股份有限公司最近发布了“朗玛·39AI全科医生”,这是一个集成了大量医学数据和健康科普数据的医疗健康人工智能产品。它的目标是像一名专家医生一样,提供更好、更全面、更准确的医学解答。该产品将主要应用于基层医疗卫生机构,旨在帮助医务人员开展临床辅助诊断服务,并提供健康咨询和管理等服务,从而提升医务人员的诊疗水平和为民众提供全生命周期的健康管理咨询服务。
31、虎博-TigerBot
虎博科技发布了自研的多模态大模型TigerBot,这是一个多语言多任务的大规模语言模型,特别注重开源,旨在推动AI技术的广泛应用和发展。TigerBot的研发历经3个月的密集开发和超过3000次的实验迭代,展现了内容生成、开放问答、信息提取等多方面能力,如辅助创作营销文案、进行长文本总结和理解等。此外,TigerBot也支持图片生成,实现了文生图的能力。
32、星环-无涯(Infinity)
"无涯"是一款针对金融量化领域的超大规模参数的生成式大语言模型,使用了上百万的专业金融语料进行二次预训练,具备了对金融通识领域准确理解的能力。它能够处理包括政策和研报分析、新闻解读、事件总结等在内的多种金融量化问题,以及生成另类的策略因子集合。
33、任意门-SoulX
上海任意门科技有限公司最近推出了一款名为“SoulX”的自研大模型,这标志着公司在AIGC(人工智能生成内容)与社交场景的深度融合方面迈出了重要一步。SoulX作为生成式人工智能的核心工具,将在Soul平台的“AIGC+社交”布局中扮演关键角色,旨在垂直应用于平台上的多元社交互动场景,如智能对话机器人、AI辅助聊天、虚拟陪伴等,进一步丰富用户的社交体验。
34、秘塔-MetaLLM
秘塔科技开发了自研大模型MetaLLM,并已通过《生成式大模型备案》。该模型基于Transformer底层架构,注入中文语料进行训练,使其产品更贴合中文文本习惯。秘塔科技以此模型推出了多款产品,包括AI搜索、AI写作等,致力于提供符合中文使用者习惯的AI工具
35、阶跃星辰-阶跃
阶跃星辰最近在全球开发者先锋大会上发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版。这些模型旨在推动通用人工智能的发展,展现出阶跃星辰在AI领域的深厚实力和创新能力。
36、思必驰-东风语言大模型
东风大模型是一个具备通用智能的行业垂域语言大模型,结合其自研的全链路智能对话平台DUI,已在智能汽车、智能家居、政务服务、医疗健康、科学研究和智慧办公等领域落地应用。
37、动悦-夸克曼大模型
38、视源-CVTE大模型
目前在AI应用方面有实际业务应用的企业里,CVTE视源股份算是其中之一,在计算机视觉、数据挖掘、语音信号处理等前沿技术领域都有相关的研究数据积累,再加上旗下品牌希沃在教育领域的数据支撑,率先将AI赋能于教育板块的相关业务并取得了良好的成绩。
39、云天励飞-云天天书大模型
“云天天书”大模型由云天励飞自主研发,包含通用大模型、行业大模型、场景大模型三个层级。云天励飞基于算法开发平台和算法芯片化平台,并通过海量高质量数据预训练生产通用大模型;在通用大模型基础上,引入高质量行业数据,生产行业大模型;再在行业大模型基础上,通过细分场景数据微调研发场景大模型。通过三级架构,实现大模型赋能千行百业。去年12月,“云天天书”已通过中央网信办备案。目前,围绕智慧政务领域,“云天天书”围绕民意速办、商事即办、公文智写、智能看数等多类数字政府场景展开探索及落地,为全面提升政务服务效率赋能。
40、心辰-西湖大模型
湖心辰是一家专注于人工智能服务研发的科技公司,已经构建了从模型层到应用层的产品架构。在模型层,公司开发了千亿级参数的语言大模型RIO和双模态图文模型。应用层面,推出了基于人工智能模型的多种应用产品,如“Hey Friday”、“造梦日记”和“小天”等。此外,公司计划将汤姆猫IP应用拓展至更多场景,如教育、智能硬件和智能家庭等。
41、同花顺-问财HithinkGPT大模型
同花顺推出的问财HithinkGPT大模型采用了transformer的decoder-only架构,提供7B、13B、30B、70B和130B五种版本选择,支持API接口调用、网页嵌入、共建、私有化部署等能力。该模型在金融领域的应用表现出色,特别是在HithinkFinEval数据集上的表现,该数据集涵盖了多个金融行业考试,问财HithinkGPT-70B大模型以平均75.9分的优异成绩通过考试,显示了其在金融领域的强大能力和应用潜力。
42、浪潮云-浪潮海若大模型
浪潮海若大模型专为行业需求设计,首批覆盖政府、交通、应急、制造、医疗、农业六大行业。它基于可信赖的云计算服务安全,便于落地,且可持续发展,确保数据本地部署、不出域的同时,满足国内外的安全评估标准。
43、美图网-奇想智能
MiracleVision(奇想智能)是美图自研的一款懂美学的AI视觉大模型,以美图深厚的美学沉淀和长期的审美趋势研究作为基础,建立美学数据训练机制和美学评估体系,为MiracleVision大模型生成高品质的图像和稳健的图像质量提供强大的支撑。
44、度小满-度小满轩辕大模型
度小满最近发布了一款名为“轩辕”的开源中文金融大模型,这是国内首个千亿级中文金融模型.轩辕模型基于BLOOM-176B语言模型,结合度小满的金融数据集,具有强大的金融领域能力和通用能力。它在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上表现出明显的优势。这个模型可以用于解释授信额度、计算收益率、提供决策参考等金融场景,为金融行业的数字化转型提供支持。
45、京东-言犀
言犀是京东智能人机交互平台,旨在助力企业服务数智化转型。它融合了京东自身十年客户服务与营销的最佳实践以及自研全链路 AI 能力,打造了服务数智化平台级智能人机交互产品。言犀从文字、语音到多模态交互,从对话智能到情感智能,聚焦体验、效率与转化,面向不同行业和客户场景,助力企业服务和营销实现数智化转型升级。
46、字跳-福禄瓜
47、中科闻歌-雅意大模型
雅意大模型是中科闻歌推出的大规模语言模型的企业级应用平台。它具备实时联网问答、领域知识问答、多语言内容理解、复杂场景信息抽取、多模态内容生成等能力,雅意大模型可应用于多个领域,包括媒体、金融、宣传、治理和安全。
48、深言-语鲸大模型
语鲸大模型是深言科技推出的中英双语大语言模型。它具备强大的语义理解、文本生成、代码理解、逻辑推理等能力,可用于文本创作、数学计算、代码补全等服务。在中文理解和生成能力上,它处于行业领先地位,更懂中文,更懂中文使用场景。
49、澜舟-孟子GPT
澜舟科技研发的孟子生成式大模型(孟子 GPT)是一款功能强大的生成式可控大语言模型。它通过多轮对话,帮助用户在特定场景中完成各种工作任务,包括内容生成、语言理解、知识问答、推理、代码理解和生成、金融任务等。
50、聆心智能-CharacterGLM
CharacterGLM超拟人大模型由聆心智能与AI大模型公司智谱AI深度合作,基于GLM基座深度优化升级打造而成,具备“六边形能力”——人格、知识、能力、社会化、成长性、价值观。超拟人大模型能提供千人千面的AI形象,满足用户聊天、陪伴的情感需求,打破了AI大模型与人类的情感交流困难的现状,号称中国版Character AI。
51、云知声-云知声山海认知大模型
云知声山海大模型 是云知声公司开发的最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。
52、快手-快意大模型
这一系列大规模语言模型(Large Language Model,LLM)由快手 AI 团队从零到一独立自主研发,目前包含了多种参数规模的模型,覆盖了预训练模型(KwaiYii-Base)和对话模型(KwaiYii-Chat)。
53、红棉小冰-小冰大模型
红棉小冰 是一家备受瞩目的人工智能公司,其最新一代大模型名为 “小冰大模型”。这一系列大规模语言模型(Large Language Model,LLM)由小冰团队独立自主研发,涵盖了多种参数规模的模型,包括预训练模型(KwaiYii-Base)和对话模型(KwaiYii-Chat)。
54、宽娱数码-bilibili index
近日,B站宣布推出bilibili index大模型,并且为目前正在内测的“搜索AI助手”功能提供技术支持.B站的“搜索AI助手”是一个内测功能,通过这个助手,用户可以快速准确地搜索到自己需要的内容。而 bilibili index大模型 不仅可以应用于搜索场景,还可以拓展到其他场景,例如内容推荐、内容生成、内容审核等,为B站的内容生态和用户服务提供更多可能性。
55、行吟-珠玑
行吟-珠玑是一款由B站推出的AI绘画大模型,它为用户提供了一种快速生成美轮美奂画作的方式。通过输入关键词、选择风格和视角,行吟-珠玑可以自动生成精美的绘画作品。这一模型不仅可以用于绘画,还可以应用于其他场景,例如内容推荐、内容生成、内容审核等,丰富了B站的内容生态和用户服务。
56、东方财富-奇思妙想
东方财富推出的奇思妙想是一款金融行业的大模型应用。作为国内首款金融行业大模型,奇思妙想直面用户投资痛点,切入多元财富场景,以创新自研的专业语料、特色算法和强大算力,为用户提供全程无忧的智能投资体验1. 这一模型不仅具备奇思妙想和智能创作两大特性,还通过“提示词智能联想”功能,自动补充关联提示词,降低大众使用门槛。在智能创作方面,奇思妙想进一步丰富作品细节和提升表现力2. 通过这一应用,用户可以快速准确地找到自己想要的内容,助力金融科技创新,重塑数字金融生态。
57、网易-易生诸相
网易伏羲的易生诸相多模态模型,包含了文生文部分(称为“玉言”)和文生图部分(称为“丹青”)。这一技术领域的积累使其成为行业领先的玉言角色扮演模型(CharacterYuyan)。这个模型具备强大的共情能力、主动性,以及高质量的人设对话能力。最近,在角色扮演能力的权威评测中,CharacterEval,玉言角色扮演模型在11项评测指标中荣膺榜首。这一突破性的成果预示着它有望为泛文化娱乐、短视频/短剧创作、影视动漫创作、教育等众多涉及角色扮演的行业提供新的解决方案,加速内容创作领域的技术变革。
58、达观数据-曹植
达观数据的“曹植”是一款大模型管理平台,专注于企业级大模型的生产、管理、训练。这个平台支持自研或开源的大模型集中管理,以及模型的fine-tuning。它还涵盖了训练数据管理、模型训练、模型评估、模型服务、指令Prompt工程、模型训练监控、GPU集群监控等全方位的管理。
曹植不仅是一个大模型管理平台,还是一个垂直领域大语言模型。它具备强大的文本生成能力,可以应用于多种场景,包括通用文本写作、金融报告撰写、申报材料自动生成等12。作为企业级大数据技术服务专家,达观数据的曹植大模型将助力企业构建规范的大模型管理和训练流程,实现数据、模型、服务、指令的有效闭环,提高效率并保证高质量的文本生成。
59、无限光年-光语
光语多模态大模型是一个强大的开源视觉语言模型(VLM),由视觉编码器(ViT)、视觉特征适配器、大语言模型(LLM)三个基本模块组成,包含10 亿视觉模型参数和 130 亿语言模型参数。模型支持图像、文本、检测框作为输入,并以文本或检测框作为输出,支持图像描述、图像问答、物体定位、基于参考位置的物体描述等功能。
60、智象未来-智象
HiDream.ai(智象未来)是一家专注于构建视觉多模态基础模型及应用的生成式人工智能初创公司,由加拿大工程院外籍院士、原京东集团副总裁梅涛博士创立。我们的使命是让智能服务人类创造美好未来,成为赋能创造力和生产力的全球领先的人工智能科技企业。
61、智臻智能-华藏
华藏通用大模型融合了最先进的神经网络和深度学习技术,具备强大的推理和创造性思维能力。通过使用这一模型,我们可以实现文本、图像、视频、3D等不同模态之间的无缝转换和互操作性。
62、竹间智能科技-竹海
竹间智能是一家专注于大语言模型的科技公司。他们的EmotiBrain平台提供了大模型训练调优、AI对话、对练培训、写作助手和知识管理等多个方面的产品。这些产品旨在帮助企业实现智能化转型,提高生产力,降低成本,并为不同领域的企业提供定制化的解决方案。此外,竹间智能还推出了1+4大模型产品体系,旨在帮助企业打通大模型落地的最后一公里。其中,EmotiBrain是大模型训练调优平台,而KKBot、Bot Factory+、Emoti Coach、Magic Writer和Knowledge Factory则是涵盖对话、对练培训、写作助手和知识管理的核心产品。
63、唯品会-朝彻大模型
朝彻则是唯品会自研的大模型,主要功能包括批量生产高质量的电商图文内容:这有助于提升用户在网购过程中的体验,同时也降低了品牌商的运营成本。
64、云从-云从从容大模型
云从科技发布了名为“从容大模型”的人工智能系统,这是一种基于语言模型的系统。它可以根据给定的文本或语音数据进行学习和分析,然后输出相关的答案或建议。从容大模型具有深度理解自然语言含义和语义规则的能力,因此在自然语言处理(NLP)领域具有诸多优势。
65、OPPO-安第斯大模型
安第斯大模型(AndesGPT)是OPPO自主训练的、个性专属大模型与智能体。作为驱动OPPO公司AI战略的核心引擎,安第斯大模型全面赋能OPPO智慧终端,持续构建知识、记忆、工具、创作能力,并通过与终端结合的AI智能体和多模态对话范式,给用户带来全新的个性专属智能体验。
66、第四范式-式说大模型
第四范式的AIGS(生成式AI软件开发平台)基于式说大模型能力,旨在提升企业软件的体验和开发效率,这个平台具备多模态大模型、知识库、企业级Copilot、思维链CoT特点。
67、零一万物-零一万物大模型
零一万物是中国创新工场的AI2.0孵化项目,由李开复博士亲自领导,致力于打造中国领先的大模型技术团队。大模型是指能够处理海量数据的人工智能模型,具有强大的通用性和创造性,可以跨领域、跨媒体、跨语言地执行各种任务,是AI2.0时代的核心技术。
零一万物走的是自主研发大模型的道路,已经完成了百亿参数级别的内部测试,并计划在未来将模型规模提升至300到700亿参数1。该团队的愿景是通过基座大模型在技术、平台和应用多个层面上推动AI 2.0的革命。他们相信,AI 2.0将创造一个比移动互联网大十倍的平台机遇,重塑所有软件和用户界面,催生下一波以AI为先导的应用和AI赋能的商业模式,从而不断推动AI 2.0的创新。
68、小米科技-小爱同学AI助手
小爱同学是小米的智能语音助手,搭载在小米手机、音箱、电视、电脑等众多小米设备中。她支持控制各种智能设备,包括灯、空调、风扇、窗帘、扫地机器人等,涵盖了77个品类和4000余款智能设备,一句话就能智联万物。
69、衔远科技-衔远品商大模型
衔远科技是一家全球领先的产品数智化技术服务公司,致力于链接消费者与商品的人工智能领域。他们自主研发了品商大模型,这是全球首个商品供应链大模型。
70、衔远科技-摹小仙
“摹小仙”大模型是由衔远科技研发的多模态模型技术,其参数规模超过35亿,专为服装、美妆、食品饮料等行业设计。该模型能够生成高度可控的商品形态、光影效果,以及模特形象,为用户提供模特定制、人台变超模等创新服务。值得一提的是,“摹小仙”引入了自研的Protected-SD技术,为AI创作内容提供版权授权、生成与追溯保护,这是行业内首个实现此类功能的模特AI商拍平台。
71、值得买-什么值得买App “AI问答机器人”新功能
什么值得买“AI问答机器人”是一款消费领域垂类产品,将通过对话形式与用户进行交互,旨在为用户提供智能的消费辅助决策服务,根据用户需求指令,帮助用户快速甄选全网优质好物链接。
72、淘友天下-脉脉APP 智能问答功能
脉脉的ChatGPT问答能力也已上线,可以在社区提问中获得实时答复。
73、网聘-智联招聘APP–AI改简历新功能
AI简历生成与修改工具由智联招聘基于大模型技术打造,目前已在智联招聘APP内面向求职者开放使用。产品既可以直接为用户生成完整规范的全新简历,也可以对用户简历进行修改优化。
74、华品博睿-南北阁
华品博睿是一家科技公司,依托自主研发的南北阁大模型,为用户提供生成式AI服务。这个大模型在BOSS直聘平台的官方网站、官方移动App和微信小程序等产品中运行,旨在向用户提供智能的消费辅助决策服务。目前,南北阁大模型仍处于内测阶段,需要激活才能使用。
75、创思远达-Rubik魔方大模型
中科创达发布的魔方(Rubik)大模型为智能汽车和其他领域的创新提供了强大的AI能力。
76、步刻科技-微步情报智脑
步刻科技的微步情报智脑XGPT是面向安全垂直领域的大模型。它将网络安全大模型与微步99.99%高精准、覆盖全球的威胁情报能力以及久经实战考验的安全检测能力相结合,具备安全知识、威胁分析、安全运营等能力,这是国内网络安全领域首个获批通过的生成式人工智能大模型。
77、新壹-新壹视频大模型
新壹视频大模型是国内首个聚焦视频人工智能生成与创作领域的语言大模型。它基于深度学习和海量视频样本,具备从脚本生成、素材匹配、智能剪辑配音到数字人播报的全流程视频生产能力。这一模型使每个人都能实现高质量、高效率、低成本、无门槛的视频创作.无论您是想制作有趣的短视频、教育培训内容,还是需要智能在线客服,新壹视频大模型都能为您提供强大的支持。
78、识因智能-轻舟大语言模型
识因智能的轻舟大语言模型是一款新一代认知智能大模型,具备千亿级多语言、多模态预训练的能力。它打破了传统AI开发的局限,实现了高效率、通用化的“模型即服务”AI开发新范式。这一模型在自然语言处理、深度语义理解、图像语义交互等领域具有广泛应用。
79、掌阅科技-阅爱聊小程序
掌阅科技旗下的阅爱聊是国内首款对话式AI应用。这一应用基于生成式人工智能驱动,专注于数字阅读领域。它融合了阅读的乐趣和对情感的需求,让用户可以与系统中的角色形象进行对话,阅读各种类型的文本内容。通过聊天对话的形式,您可以轻松地阅读名著或小说,让阅读成为更加愉悦、有趣的体验。
80、昶廿-如意
基于人工智能技术的电商导购应用。
81、阅文-阅文妙笔
阅文妙笔,这是国内首个专注于网文的大型模型。作为阅文集团推出的创作助手,它深入理解网文的内容逻辑和语言风格,成为作者的“金手指”。
82、巨人网络-GiantGPT
GiantGPT是专注于游戏业务的垂类大模型,结合高质量自有数据和互联网公共数据进行训练,对角色演绎、情景推理和长期记忆等基础能力进行了深度优化。在巨人自有游戏业务场景中,GiantGPT的表现显著优于国内外的闭源通用大模型。
83、蜜度蜜巢-蜜巢
蜜度科技的蜜巢大模型是专注于游戏业务的垂类大模型。它结合高质量的自有数据和互联网公共数据进行训练,对角色演绎、情景推理和长期记忆等基础能力进行了深度优化。蜜巢在巨人自有游戏业务场景中的表现显著优于国内外的闭源通用大模型。
84、松鼠云-松鼠Ai教育大模型
松鼠Ai的这一大模型结合了智能自适应学习技术,旨在改变学习理念和方法。它能够根据学情数据,为学习者设计个性化的学习路径,推送相应的学习资源。这是全球范围内首次将智适应技术与多模态大模型结合的探索。
85、数尺-瀚海
瀚海大模型平台(简称HHLM Platform)是面向企业开发者的一站式大模型训练及推理服务平台1。该平台支持数据管理、一键微调、推理优化、在线评测等核心能力,助力各行业的生成式AI应用需求落地。
86、星图比特-奇点华章
奇点华章专注于出版传媒领域,它在传统采编系统的基础上融合了新一代生成式和判别式人工智能。其主要功能包括辅助内容生产和内容安全,旨在提高内容生产效率和质量,保障文章的一致性、准确性和安全性。这个大模型的应用范围涵盖了内容生产、文本审核、安全检测和内容分发等整个工作流程,对于文字工作者来说,它能够提高效率,让他们每天能提早1小时下班。通过「奇点华章」,编辑和作者可以更好地利用AI技术,从而创作出更高质量的作品。
87、中国移动-九天自然语言交互大模型
中国移动-九天自然语言交互大模型以原创的体系化人工智能技术为内核,自主创新了全链路核心技术,包括数据构建、预训练、微调和推理等。九天自然语言交互大模型的应用范围广泛,包括内容产业、网络、客服、政务、医疗、工业等领域。它在内容生产、文本审核、安全检测和内容分发等工作流程中发挥着关键作用,帮助文字工作者提高效率,提升文章的一致性、准确性和安全性。
88、淘宝-星辰大模型
淘宝星辰大模型是以电商和生活服务为主要适用场景。提供商品文案编写、商品商家运营、商品数据分析、市场营销策略等经营场景下的智能服务,帮助商家降本增效,为平台消费者提供生活服务推荐、商品智能搜索、商品喜好推荐、个性化商品捕捉、固定场景产品推荐等智能服务,提供全新的消费体验。
89、传播大脑-传播大模型
传播大模型专注于传播领域,它在传统采编系统的基础上融合了新一代生成式和判别式人工智能。其主要功能包括辅助内容生产和内容安全,旨在提高内容生产效率和质量,保障文章的一致性、准确性和安全性。这个大模型的应用范围涵盖了内容产业、网络、客服、政务、医疗、工业等领域。它在内容生产、文本审核、安全检测和内容分发等工作流程中发挥着关键作用,帮助文字工作者提高效率,提升文章的一致性、准确性和安全性。
90、新华三-灵犀大模型
新华三集团推出了一款名为“百业灵犀” 的私域大模型,旨在为垂直行业和特定地域的客户提供智能化服务,此外,百业灵犀大模型使能平台是一站式服务平台,帮助行业客户激活私域大模型,快速构建智能应用,实现“模型使用自由”。作为新华三AIGC解决方案的一部分,百业灵犀AI助手是用户使用大模型的统一入口,支持自然语言人机对话,帮助用户快速上手大模型。
91、佳都科技-佳都知行大模型
佳都科技近期发布了名为“知行交通大模型”的创新产品,专注于智慧交通领域。这个大模型基于Transformer技术,融合了多轮对话、复杂推理、数据分析、知识问答和强大的内容生成能力。它结合了交通行业特定的数据和信息,旨在为城市交通行业提供智能化、高效实时的解决方案和决策支持。
92、鹏城-鹏城脑海
鹏城实验室最近发布了名为“鹏城·脑海”的通用人工智能大模型。这一创新产品旨在构建新一代AI大模型,以国产化基座大模型为基础,这个基础版的“鹏城·脑海”以中文为核心,将在OpenI启智社区向全社会开源。
93、TCL-TCL大模型助手
TCL大模型算法搭载于TCL+ App智能助手之上,致力于为用户提供一站式的智能家电解决方案。该助手能够根据用户的需求和问题,向用户提供智能家电产品的功能解释、使用方法、设备远程控制以及售后问题等方面的专业解答。
94、荣耀软件-魔法大模型
荣耀发布其自研端侧平台级AI大模型——魔法大模型,将首次搭载于即将发布的荣耀Magic 6系列机型。据介绍,“魔法大模型”为荣耀带来了智慧成片、图库语义搜索、一拖日程等功能,这些都是在端侧本地运行的。
95、蜜度文修-蜜度文修
蜜度文修,作为国内首个专注于智能校对领域的垂直领域大语言模型,于2023年世界人工智能大会上隆重发布。这一模型不仅凝聚了蜜度在智能校对领域多年的经验,更是以专业智能化服务赋能各行各业的方式,为中文校对和润色能力提供了智能化的解决方案.蜜度文修的强大之处在于它能够在短短90秒内校对20万字的文稿,覆盖错词病句、常识错误与不规范表述等层面,并给出修正与润色建议。这对于新闻出版、政务公文等专业领域的工作模式升级具有重要意义。
96、联想-天禧大模型
联想天禧AI生态于2023年12月26日正式发布,旨在打造全终端AI融合体验。这一战略以“四端一体”为核心,涵盖了AI PC、AI平板、AI手机和AIoT四类AI终端设备,联想天禧AI生态的目标是成为全终端AI融合体验服务商,加速推动AI的普及和应用。
97、车励行-Mind GPT
Mind GPT是理想全自研的多模态认知大模型,它可以与汽车进行一个完美的融合,让每位家庭成员都能在车里体验到最好的AI(爱),理想汽车称,其从0到1构建了Mind GPT原始基座模型,模型结构采用了自研的TaskFormer神经网络架构,基于用车、娱乐、出行等场景使用SFT、RLHF等技术进行了一系列的训练,让Mind GPT拥有了理解、生成、知识记忆及推理的三大能力。
98、车励行-Mind Diffusion图像生成模型
车励行的Mind Diffusion图像生成模型是一种文本到图像扩散模型,具有前所未有的逼真度和深度的语言理解。它结合了大型Transformer语言模型(例如T5)在理解文本方面的能力,以及高保真度图像生成中扩散模型的优势,扩散模型在图像生成任务中表现出显著的性能,已经取代了GANs。这些模型不仅能够产生更多样化的图像,而且还能保留数据的语义结构,不受模式崩溃的影响。
99、爱奇艺-爱奇艺AI对话产品
100、贝壳-贝壳ChatHome语言大模型
ChatHome是一个专门为家装改造设计的语言模型,包括两个步骤:首先,使用涵盖专业文章、标准文件和网络内容的广泛家装改造数据集对通用模型进行预训练后调整;其次,使用家装改造为基础的提示生成的问题-回答对数据集实现指令调整策略。
101、贝壳-贝壳梦想家大模型
102、汉王-天地大模型
天地大模型的命名灵感源自中国传统文化中的“天圆地方”。这一模型具备强大的自然语言处理能力和人工智能技术,适用于多个领域,包括古文、法律、教育、办公、医养等,
103、好课帮助-“柠咖相机”产品
104、印象笔记-印象大语言模型
「印象AI」是基于印象笔记多年自研的轻量化大语言模型「大象GPT」和国内外大语言模型相结合的混合模型方案。「印象AI」的功能不仅限于开放式写作助理,而是将深入到知识管理的各个环节,辅助实现完善信息记录、高效信息整理、智能多模态信息关联与创作内容的润色和升华,成为由GPT驱动的多模态、全能知识管理助理。
105、生数-UniDiffuser多模态大模型
生数科技是一家全球领先的自主研发多模态通用大模型的人工智能企业 ,布局MaaS(模型即服务)与应用级产品,面向艺术设计、游戏制作、影视动画、社交娱乐等领域提供赋能。2023年9月,生数科技发布产业级多模态大模型,全链路自主研发,在图像生成、3D生成、短视频生成等多项任务中达到国际一流水平。
106、网聘-智联招聘APP—AI招聘助手新功能
「智联招聘」的 AI招聘助手 新功能是一项创新性的多模态大模型,AI易面是智联招聘旗下的人才评估与发展平台,利用大数据和AI技术,专注于人才测评与AI视频面试的深度结合。该功能解决了远程招聘市场的需求,为企业提供了新的解决方案。AI易面模拟真实面试场景,结合视频分析技术、语音分析技术、深度语义理解技术、人脸特征识别技术和测量技术。它对候选人的岗位素质进行全面分析评估,最终解析候选人的人才画像。
107、奇点星宇-片羽图像生成大模型
应用于图像生成场景,根据用户输入的图像或文本描述,生成与输入语义信息一致的图像。
108、滴滴-滴滴出行大模型
滴滴大模型以部分个人出行和企业差旅为场景,通过引入人工智能技术,提升用户出行和差旅规划的效率。在个人出行方面,大模型将通过分析用户的出行习惯和需求,为用户提供更加个性化、精准的出行建议和规划。在企业差旅方面,大模型将通过对企业差旅数据的分析和管理,帮助企业更好地管理和规划差旅支出,提高差旅管理的效率和透明度。
109、万兴-万兴天幕多媒体大模型
万兴“天幕”是国内首个专注于以视频创意应用为核心的多媒体大模型,从使用场景来看,万兴天幕适用于各种需要音视频创作的场景。无论是视频编辑、动画制作、游戏设计还是虚拟现实等领域,万兴天幕都能提供强大的技术支持,让创作者能够更加高效地进行创作。
110、视旅科技-视旅VtripGPT大模型
视旅科技开发的VtripGPT大模型,可以提供丰富多样的旅游服务,包括行程前的AI攻略生成、AI行程规划、动态商品组合生成和便捷的一键交易;行程中的智能履约及在地推荐;以及行程后的AIGC内容生成及分享等。
111、卓世-璇玑玉衡
卓世科技的人工智能大模型解决方案在教育领域的应用主要通过自研的卓世·璇玑玉衡知识增强型教育行业模型实现。该模型以智慧教学、智慧学习和智慧管理三大场景为核心,提供全链路、全场景、全周期的综合解决方案。
112、长虹电器-长虹云帆
长虹发布的全球首个智慧家电AI平台-云帆,标志着长虹在智慧家庭领域迈入了“强人工智能”时代。云帆AI平台拥有多维感知、多重理解、多任务管理、多模交互、内容激发的五大能力,它可以“如你所愿”、“知你所想”、“懂你所需”,让电视使用超简单、交互超方便、功能超强大。
113、OPPO-AndesGPT-LVM
OPPO正式推出OPPO自主训练的大模型——AndesGPT。AndesGPT拥有对话增强、个性专属和端云协同三大技术特征,其核心能力聚焦在知识、记忆、工具与创作四大方向。
114、冠岳-翼绘AI
115、视源-CVTE大模型(自研)
国内智能交互平板龙头企业视源股份研发的希沃教学大模型是一款应用在教育领域的专用模型,致力于培养教师驾驭人工智能的能力,提升教师利用数字技术优化、创新和变革教育教学活动的意识、能力和责任,助力培养教师数字素养。
116、荣耀-YOYO助理(PC版)
117、荣耀-YOYO助理(移动版)
荣耀(Honor) 的YOYO助理是一款智能语音助手,可以通过自然语言和手机进行互动。当你不方便动手,或者希望手机自动完成任务时,唤醒手机上的YOYO助理,说出指令即可。
资讯来源:“与数据同行”微信公众号
20 天前
📢 OpenAI即将发布GPT-4.1,多模态能力再升级! 据多家科技媒体报道,OpenAI计划于下周(2025年4月中旬)推出GPT-4.1,作为GPT-4o的升级版本,进一步强化多模态推理能力,并推出轻量级mini和nano版本。 🔍 关键升级点 更强的多模态处理 GPT-4.1将优化对文本、音频、图像的实时处理能力,提升跨模态交互的流畅度。 相比GPT-4o,新模型在复杂推理任务(如视频理解、语音合成等)上表现更优。 轻量化版本(mini & nano) GPT-4.1 mini 和 nano 将面向不同应用场景,降低计算资源需求,适合移动端或嵌入式设备。 配套新模型(o3 & o4 mini) OpenAI还将推出o3推理模型(满血版)和o4 mini,优化特定任务性能。 部分代码已在ChatGPT网页端被发现,表明发布临近。 ⏳ 发布时间与不确定性 原定下周发布,但OpenAI CEO Sam Altman 曾预警可能因算力限制调整计划。 同期,ChatGPT已升级长期记忆功能,可回顾用户历史对话,提供个性化服务(Plus/Pro用户已开放)。 🌍 行业影响 谷歌(Gemini AI)和微软(Copilot)近期也强化了AI记忆功能,竞争加剧。 GPT-4.1可能进一步巩固OpenAI在多模态AI领域的领先地位,推动商业应用(如智能客服、内容创作等)。 📌 总结:GPT-4.1的发布标志着OpenAI在多模态AI上的又一次突破,但具体性能提升和落地效果仍需观察。我们将持续关注官方更新! (综合自腾讯新闻、The Verge、搜狐等)
2 个月前
BERT(Bidirectional Encoder Representations from Transformers)是由Google于2018年发布的一种预训练语言模型,基于Transformer架构,用于自然语言处理(NLP)任务。它的双向(Bidirectional)上下文理解能力使其在文本理解、问答系统、文本分类等任务中表现卓越。 BERT的核心特点 1. 双向上下文理解 传统语言模型(如GPT)通常是单向的(从左到右或从右到左)。 BERT采用Masked Language Model(MLM,掩码语言模型),即在训练过程中随机遮挡部分词语,并让模型根据上下文预测这些被遮挡的词,从而实现双向理解。 2. 预训练+微调(Pre-training & Fine-tuning) 预训练(Pre-training):在海量无标注文本数据(如维基百科、BooksCorpus)上进行训练,使BERT学会通用的语言知识。 微调(Fine-tuning):针对具体任务(如情感分析、问答系统、命名实体识别)进行轻量级训练,只需少量数据,即可获得良好效果。 3. 基于Transformer架构 BERT使用多层Transformer编码器,通过自注意力(Self-Attention)机制高效建模文本中的远程依赖关系。 Transformer结构相比RNN和LSTM,更适合并行计算,处理长文本能力更强。 BERT的两大核心任务 Masked Language Model(MLM,掩码语言模型) 在训练时,随机遮挡输入文本中的15%单词,让模型根据上下文预测这些词。 这种方法使BERT学习到更深层次的语言表示能力。 Next Sentence Prediction(NSP,下一句预测) 让模型判断两个句子是否是相邻句: IsNext(相关):句子A和B是原始文本中相连的句子。 NotNext(无关):句子B是随机选择的,与A无关。 这一任务有助于提高BERT在问答、阅读理解等任务中的能力。 BERT的不同版本 BERT-Base:12层Transformer(L=12)、隐藏层768维(H=768)、12个自注意力头(A=12),总参数110M。 BERT-Large:24层Transformer(L=24)、隐藏层1024维(H=1024)、16个自注意力头(A=16),总参数340M。 DistilBERT:更小更快的BERT变体,参数量约为BERT的一半,但性能接近。 RoBERTa:改进版BERT,去除了NSP任务,并采用更大数据量进行训练,提高了性能。 BERT的应用 BERT可以应用于多种NLP任务,包括: 文本分类(如垃圾邮件检测、情感分析) 命名实体识别(NER)(如人名、地名、组织识别) 阅读理解(QA)(如SQuAD问答) 文本摘要 机器翻译 搜索引擎优化(SEO)(Google已将BERT用于搜索算法) BERT的影响 推动NLP进入预训练时代:BERT的成功引发了NLP领域的“预训练+微调”范式(如GPT、T5、XLNet等)。 提升搜索引擎性能:Google 在搜索引擎中使用BERT,提高查询理解能力。 加速AI技术发展:BERT的开源推动了自然语言处理技术在学术界和工业界的广泛应用。 总结 BERT是Transformer架构的双向预训练模型,通过MLM和NSP任务学习通用语言知识,在NLP领域取得巨大突破。它的成功奠定了现代大模型预训练+微调的范式,被广泛用于搜索、问答、文本分类等任务。
2 个月前
如何整合大模型API并提供开发者服务 随着人工智能技术的快速发展,越来越多的开发者希望在自己的应用中集成AI能力,如自然语言处理、图像生成、语音识别等。如果你计划搭建一个AI平台,并向开发者(B2C)提供AI API服务,那么本文将详细介绍如何整合现有大模型的API,并成为官方分销商。 1. 选择合适的大模型API 当前市场上已有多个强大的AI大模型提供API服务,以下是几家主流供应商: OpenAI(ChatGPT/GPT-4):适用于通用对话、文本生成、代码补全等。 Anthropic(Claude):擅长安全对话和长文本理解。 Google Gemini(原Bard):适合多模态(文本、图像)AI应用。 Mistral AI:提供高效、开源的AI模型,适合灵活集成。 Hugging Face:开放API,可用于多种NLP任务。 Stable Diffusion/DALL·E:用于图像生成。 Whisper API:优秀的语音识别能力。 选择API时,需要考虑成本、调用限制、商业许可、模型能力等因素。 2. 如何获得大模型API的分销权限? 如果你希望不仅是API的用户,还能将API分发给开发者,需要与AI公司建立更深层次的合作关系。不同公司有不同的合作方式: OpenAI(ChatGPT/GPT-4) 标准API使用:直接在OpenAI官网注册并获取API Key。 企业级API访问:通过 OpenAI Enterprise 申请更高额度的API。 成为OpenAI API Reseller(API分销商):需要直接联系OpenAI商务团队(sales@openai.com)并提供业务计划,通常要求较大的流量或消费额度。 Anthropic(Claude) 访问 Anthropic API 并申请企业合作。 需要提供详细的业务应用场景,并确保数据安全合规。 直接联系 sales@anthropic.com 申请API分销权限。 Google Gemini(原Bard) 使用 Google AI Studio 获取API。 申请Google Cloud AI企业级API,并与Google商务团队合作。 通过 Google Cloud AI Solutions 申请大规模API使用权限。 Mistral AI 访问 Mistral API 并申请企业级合作。 直接联系 Mistral 商务团队申请API分销许可。 Hugging Face 访问 Hugging Face Inference API。 联系 Hugging Face 申请企业API许可,并可能合作进行API优化。 3. 技术架构:如何整合多个API? 如果你希望提供一个集成多个AI API的服务平台,你需要构建一个API管理系统,包括: (1)API网关与管理 API网关(API Gateway):使用 Kong、AWS API Gateway、Apigee 统一管理所有API。 身份认证(Authentication):使用 JWT Token 或 OAuth2 进行用户管理。 负载均衡与缓存:结合 Redis 或 Cloudflare 优化API请求速度。 (2)用户管理与计费系统 API密钥管理:允许用户注册并申请API Key。 调用监控与限流:防止滥用,确保稳定性。 计费系统:使用 Stripe、PayPal 提供按量计费或订阅计划。 (3)前端支持与开发者体验 API文档:使用 Swagger UI 或 Redoc 提供清晰的API说明。 SDK支持:开发 Python/Node.js SDK 方便开发者集成。 在线测试环境:允许开发者在Web端试用API调用。 4. 商业模式:如何盈利? 如果你计划向开发者提供API服务,可以采用以下盈利模式: (1)免费+付费模式 提供 免费调用额度(如每月100次),超出后按量付费。 按不同模型提供不同的价格(GPT-4 高级版 vs GPT-3.5 免费版)。 (2)订阅模式 个人套餐:低价格,适合独立开发者。 企业套餐:支持高并发调用,并提供专属API密钥。 定制服务:为大型企业或团队提供专属AI API。 (3)增值服务 提供高优先级的API访问,减少延迟。 允许用户定制API模型参数,提高个性化。 结合其他工具,如AI自动化工作流、数据分析等。 5. 未来展望 随着AI技术的普及,越来越多的开发者希望将大模型能力集成到他们的产品中。如果你能整合多个AI API,并提供易用的开发者服务,将能在这一市场获得先机。通过与OpenAI、Anthropic、Google等公司建立合作,并搭建高效的API管理系统,你可以打造一个强大的AI API分发平台,为全球开发者提供优质的AI服务。 如果你有意向进入这一领域,不妨立即申请各大AI公司的企业级API,并开始搭建你的API分发平台!
2 个月前
Scaling Law 在人工智能领域的解释 Scaling Law(缩放定律)是人工智能(AI)领域中的一个核心概念,用于描述模型性能如何随着模型规模(如参数数量)、数据集大小和计算资源的增加而变化。这一规律通常遵循幂律关系,即模型性能随规模的增长呈指数或幂次提升,但提升速度会逐渐放缓并趋于上限。 核心概念 模型规模:包括模型的参数数量、层数等。例如,GPT系列模型通过不断增加参数数量实现了性能的显著提升。 数据集大小:训练数据的规模对模型性能有直接影响。更大的数据集通常能带来更好的泛化能力。 计算资源:包括训练所需的计算量(如GPU/TPU资源)和时间。计算资源的增加可以加速训练过程并提升模型性能。 幂律关系 Scaling Law 的核心是幂律关系,即模型性能 ( Y ) 与模型规模 ( X ) 的关系可以表示为 ( Y = kX^n ),其中 ( k ) 为常数,( n ) 为幂指数。例如,腾讯的 Hunyuan-Large 模型的 Scaling Law 公式为 ( C \approx 9.59ND + 2.3 \times 10^8D ),揭示了模型性能与参数数量和数据量的关系。 实践意义 资源优化:通过 Scaling Law,研究人员可以预测增加模型规模或计算资源是否能够带来显著的性能提升,从而优化资源配置。 模型设计:Scaling Law 为大规模模型的设计提供了理论支持,例如 OpenAI 的 GPT 系列和百度的 MoE 模型。 性能预测:帮助研究人员在资源有限的情况下,平衡模型规模、数据量和计算资源,以达到最佳性能。 应用实例 GPT 系列:OpenAI 通过系统性地增加模型规模,展示了 Scaling Law 在实践中的有效性。 Hunyuan-Large:腾讯的开源 MoE 模型,其 Scaling Law 公式为模型开发提供了重要指导。 迁移学习:斯坦福大学和谷歌的研究表明,预训练数据集大小与下游任务性能之间的关系也遵循 Scaling Law。 挑战与未来方向 数据资源枯竭:随着互联网数据的接近枯竭,Scaling Law 面临数据不足的挑战。 算法创新:当前 Transformer 架构的局限性促使研究人员探索更高效的算法,如 DeepSeek-R1-Zero 通过强化学习实现了突破。 新范式探索:Scaling Law 正在向后训练和推理阶段转移,研究重点从单纯追求规模转向优化数据质量和挖掘模型潜力。 结论 Scaling Law 是 AI 领域的重要理论工具,为大规模模型的设计和优化提供了科学依据。尽管面临数据资源和算法创新的挑战,但其在推动 AI 技术进步中的作用不可替代。未来,随着研究的深入,Scaling Law 的应用将更加精细化和多样化。
2 个月前
2月18日,阶跃星辰联合吉利汽车集团开源了两款阶跃Step系列多模态大模型——Step - Video - T2V视频生成模型和Step - Audio语音模型,采用MIT协议,支持免费商用、任意修改和衍生开发。 两款模型的具体信息如下: Step - Video - T2V 参数与生成能力:参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频,能确保生成的视频内容具有极高的信息密度和强大的一致性。 生成效果优势:在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出。对复杂运动场景把控能力强,能展现各种高难度运动画面;是运镜大师,支持多种镜头运动方式和景别切换;像“十级画师”,生成的人物形象逼真、生动,细节丰富,表情自然。 评测情况:阶跃星辰发布并开源了针对文生视频质量评测的新基准数据集Step - Video - T2V - Eval。评测结果显示,Step - Video - T2V的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面的表现,均显著超过市面上既有的效果最佳的开源视频模型。 Step - Audio 功能特性:是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。可支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下应用需求。 模型性能:在LlaMA Question、Web Questions等5大主流公开测试集中,模型性能均超过了行业内同类型开源模型,位列第一。在HSK - 6(汉语水平考试六级)评测中的表现尤为突出,被称为最懂中国话的开源语音交互大模型。阶跃星辰自建并开源了多维度评估体系StepEval - Audio - 360基准测试,经人工横评后,Step - Audio的模型能力均衡,在各个维度上均超过了此前市面上效果最佳的开源语音模型。
2 个月前
随着DeepSeek-R1的出现,相较于以往的大模型,带来了更先进的语义理解和数据处理能力,AI技术迎来了新的里程碑。喆塔科技作为国产领先的数智化平台领跑者,其“喆学大模型”通过融合行业Know-How与AI、大数据和云计算技术,在良率提升、效率优化及成本控制方面已取得显著成效。 Zeta科技宣布喆学模型接入R1模型 DeepSeek-R1的接入,“喆学大模型”能够更精准地分析复杂工业数据,提前预测设备故障,并提供科学决策建议,优化资源利用。这一结合为半导体、光电显示、新能源等高端制造行业注入了新的变革力量,帮助企业在这个竞争激烈的时代中保持领先。 接入DeepSeek-R1以后,喆学大模型显著增强了其在智能问答、决策支持、自我进化、易用性和垂直应用开发等方面的能力。这一创新不仅大幅降低了企业的学习门槛和技术障碍,还显著提升了工作效率和准确性,为企业实现更高效的生产和管理提供了强有力的支持。通过将复杂的数据转化为可操作的见解,并为决策提供科学依据,喆学大模型帮助企业应对工业AI时代的挑战,推动其实现数字化、智能化转型的新飞跃。 这些应用场景大模型智能问答超便捷: 工程师在工作中遇到困难,只要输入问题,就能马上得到详细的答案,它能为你画图表、做分析、写报告就像身边随时有个百事通,工作效率想不高都难。 良率分析小助手:紧盯分析数据,多轮智能问答,智能问答出图,快速给出建议,节省繁琐、重复操作步骤,提升分析效率。 Text2SQL真方便:业务人员不用再费劲去学复杂的 SQL 语言了,轻松就能查询数据,工作变得更轻松。 智能 BI 很直观:它能把业务数据深度分析,还能以可视化的形式呈现出来,市场预测和策略建议都能精准给出,企业发展更有方向。 例如: 在半导体行业,面对复杂良率分析和新员工上手难的问题,喆塔科技提供了融合喆学大模型与自动良率分析的解决方案。通过智能问答模块,新手能快速掌握分析流程和数据获取;指令生成功能依据用户偏好一键创建图表,简化操作;智能根因分析则迅速定位良率问题并提供决策支持。 (信息来源:芯湃资本)
2 个月前
2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目公布更新:一块24G显存的4090D,就可以在本地运行DeepSeek-R1、V3的671B“满血版”。 预处理速度最高达到286 tokens/s,推理生成速度最高能达到14 tokens/s。 KTransformers通过优化本地机器上的LLM部署,帮助解决资源限制问题。该框架采用了异构计算、先进量化技术、稀疏注意力机制等多种创新手段,提升了模型的计算效率,并具备处理长上下文序列的能力。
3 个月前
腾讯混元大模型的数学原理主要基于深度学习和自然语言处理领域的相关技术,以下是其核心要点: 神经网络与Transformer架构 多层神经网络:混元大模型采用多层神经网络结构,通过模拟人脑神经元之间的连接来处理和学习数据。每个神经元接收来自上一层神经元的输入,并通过激活函数进行处理后输出到下一层神经元,从而实现对数据的特征提取和模型的训练。 Transformer核心机制:混元大模型基于Transformer架构,其核心是自注意力机制。自注意力机制能够计算文本中每个位置与其他位置之间的关联程度,从而捕捉长距离依赖关系,更好地理解句子中的上下文信息。在计算自注意力时,对于输入序列中的每个位置,会计算其与其他位置的注意力得分,然后根据这些得分对相应位置的特征进行加权求和,得到该位置的新特征表示。除了自注意力机制外,Transformer还包括前馈神经网络,用于对经过自注意力机制处理后的特征进行进一步的非线性变换。 预训练与微调 预训练:在大规模语料库上预先训练模型,使其学习语言的一般规律和知识,如语法、语义、常见的语言模式等。预训练过程通常采用无监督学习的方式,例如使用大量的文本数据进行自监督学习,让模型自动预测文本中的下一个单词或句子中的空缺部分等。通过预训练,模型能够获得丰富的语言知识和语义理解能力,为后续的微调任务奠定基础。 微调:在预训练完成后,根据具体的任务需求,对模型进行微调。微调是在特定的有标注数据集上进行的有监督学习过程,通过调整模型的参数,使其在特定任务上达到更好的性能。例如,在文本分类任务中,使用标注好的文本分类数据集对预训练模型进行微调,让模型学习到如何根据输入文本的特征进行分类。 优化算法与正则化技术 优化算法:在训练过程中,使用优化算法来调整模型的参数,以最小化预测误差。常见的优化算法如随机梯度下降(SGD)及其变种Adagrad、Adadelta、RMSProp、Adam等。这些算法通过计算损失函数对模型参数的梯度,并根据梯度的方向和大小来更新参数,使得模型在训练过程中逐渐收敛到最优解。 正则化技术:为了减少过拟合,提高模型的泛化能力,混元大模型采用了正则化技术,如Dropout和Batch Normalization。Dropout在训练过程中随机丢弃一部分神经元,使得模型在每次训练时都使用不同的子网络结构,从而增加模型的鲁棒性和泛化能力。Batch Normalization则是对每个批次的输入数据进行归一化处理,使得模型在训练过程中输入数据的分布更加稳定,加快训练速度并提高模型的性能。 混合专家模型结构 混元大模型采用混合专家模型结构,每一层包含多个并行的同构专家,一次token的前向计算只会激活部分专家,推理成本远低于同等参数的稠密模型。同时,在路由策略上进行创新,在传统Top-K路由的基础上进一步提出了随机补偿的路由方式,将因为专家满负载原本会扔掉的token,随机路由到其他仍有负载冗余的专家,保障训练稳定性。还设置一个共享专家来捕获所有token所需的共同知识,并通过多个需要路由的专家动态学习特定领域的知识。 处理长文与提升推理效率 长文处理:对于长文领域,通过引入多阶段预训练和退火机制,使得模型仅使用少量长文合成语料,即可获得较好的长文效果,显著提升模型长文外推能力。 推理效率提升:使用Grouped-Query Attention和Cross-Layer Attention两种KV Cache压缩策略,从head/layer两个维度联合压缩KV cache,并引入量化技术,进一步提升压缩比,最终将模型的KV Cache压缩为MHA的5%,大幅提升推理性能。
3 个月前
杭州在AI领域崛起有城市“基因密码”,使得杭州在人工智能技术,特别是语言大模型领域引领全球。
4 个月前
以下是基于API调用费用的10大语言大模型价格比较表格,整理自最新公开信息: 模型名称 提供商 输入价格($/1M tokens) 输出价格($/1M tokens) 上下文长度 备注 GPT-4 OpenAI 30.00 60.00 8K 高性能模型,适合复杂任务。 GPT-4 Turbo OpenAI 10.00 30.00 128K 性价比更高,支持更长上下文。 GPT-4o OpenAI 5.00 15.00 128K 多模态模型,价格较低。 GPT-3.5 Turbo OpenAI 0.50 1.50 16K 经济实惠,适合轻量任务。 Claude 3 Opus Anthropic 15.00 75.00 200K 高性能,适合复杂任务。 Claude 3 Sonnet Anthropic 3.00 15.00 200K 性价比高,适合中等复杂度任务。 Claude 3 Haiku Anthropic 0.25 1.25 200K 轻量级,适合简单任务。 Gemini 1.5 Pro Google 3.50 10.05 1M 支持超长上下文,适合复杂任务。 Gemini 1.5 Flash Google 0.13 0.38 1M 轻量级,适合快速响应任务。 通义千问 Qwen-Max 阿里云 40.00 120.00 8K 高性能,适合复杂任务。 文心一言 ERNIE-4.0 百度 30.00 90.00 8K 高性能,适合中文任务。 讯飞星火 Spark Max 科大讯飞 0.21~0.30 0.63~0.90 32K 轻量级,适合中文任务。 Kimi Moonshot-v1 月之暗面 12.00 24.00 8K 超长上下文支持,适合复杂任务。 DeepSeek Chat DeepSeek 0.14 0.28 128K 轻量级,适合快速响应任务。 Llama 3 70B Meta 0.67 2.75 8K 开源模型,性价比高。 说明: 价格单位:所有价格以美元计,单位为每百万tokens(1M tokens)。 上下文长度:表示模型支持的上下文长度,单位为tokens。 免费额度:部分厂商提供免费额度,适合测试或轻量使用。 价格变动:API调用费用可能随厂商政策调整,建议关注官方最新公告。 如需更详细的价格信息或免费额度详情,可参考相关来源。