FLUX 是由 Black Forest Labs 开发的新图像生成模型,Stable Diffusion 的幕后团队。FLUX 标志着 AI 生成艺术领域的重大进步。这款最先进的模型有三种不同的变体:
FLUX.1 [pro]:FLUX.1 系列的巅峰,提供顶级的图像生成性能。
FLUX.1 [dev]:一种开放权重、指导蒸馏模型,设计用于非商业用途。它提供与 FLUX.1 [pro] 相似的质量和提示依从性,但效率更高。
FLUX.1 [schnell]:最快的型号变体,优化用于本地开发和个人使用,并且在 Apache 2.0 许可证下提供。
FLUX.1 模型在提示依从性、视觉质量、图像细节和输出多样性方面表现出色。它们处理文本的精确度异常高,能够忠实地遵循复杂的场景构图指令,并比以前的模型更准确地生成手部图像。
FLUX.1 重新定义了 AI 生成艺术的可能性。以下是其突出特点:
文本精确度:FLUX 能够轻松处理复杂的单词和重复的字母,不像旧模型。这使其在需要文本精确度的设计中表现出色。
复杂构图:FLUX 擅长解释和执行详细的物体放置和场景构图指令,能够从复杂的提示中生成准确的场景。
逼真的手部:历史上,生成逼真的手部一直是 AI 艺术模型的挑战。FLUX 在这方面取得了显著进展,生成的手部具有正确数量的手指和准确的位置。虽然不是完美无缺,但相对于以前的模型有显著改进。
效率:FLUX 的 dev 和 schnell 变体提供与 pro 版本相似的质量,同时在尺寸和速度上更高效,促进更快的迭代和实验。
多样性:FLUX 可以生成从写实到绘画风格再到插画风格的广泛艺术风格,为艺术表达开辟了新的途径。
15 天前
2024年8月,德国黑森林AI实验室(Black Forest Labs)正式从隐身模式走向公众视野,发布了备受瞩目的FLUX.1模型套件。这套模型在各个方面都达到了新的行业标准,迅速在AI图像生成领域掀起波澜。FLUX.1模型在用户评价中超越了Midjourney和OpenAI的DALL-E,在Hugging Face平台上的下载量占据榜首。 黑森林AI实验室在今年五月份推出的名为“Kontext”的AI模型系列,不仅能生成图像,还能在图像生成之后进行复杂的编辑。这种双重能力让Kontext在拥挤的AI视觉模型市场中脱颖而出,与市面上的DALL·E或Stable Diffusion不同,Kontext在统一架构中同时训练图像生成和编辑任务,实现更准确的图像理解与上下文编辑能力。 .
1 个月前
SAP联合创始人、亿万富翁Hasso Plattner计划对位于波茨坦的前勃兰登堡州议会大楼进行重大投资,将其改造为波茨坦大学的第四个校区。这一举措意在将波茨坦打造为“欧洲的斯坦福”,进一步巩固其在科技、研究与创新领域的地位。 项目核心内容包括: 对年久失修、甚至在2023年曾发生火灾的前议会建筑进行修复与重建; 在该地建设新的教学和研究设施,为波茨坦大学提供更多空间; 扩展现有的Hasso Plattner研究所(HPI),加强软件工程与数字创新研究; 投资覆盖波茨坦大学的Golm、Griebnitzsee等校区。 人工智能将成为学术发展的重点 普拉特纳在一份声明中阐明了目标,即实现 “国际领先的研究与教学”,重点聚焦于人工智能(AI)。“欧洲需要这样的地方,让来自世界各地的人才能够自由思考、研究和创造 —— 波茨坦将成为这样一个地方。” 资金与影响: 虽然具体金额未公开,但预计是数十亿欧元级别。此投资对于财政压力较大的勃兰登堡州意义重大,尤其是在该州计划新举债约20亿欧元的背景下。 Plattner的地区影响力: 他曾出资重建州议会大楼外立面,创建了Barberini博物馆和Minsk艺术馆。他在波茨坦Griebnitzsee拥有住所,并通过其基金会深度参与当地教育与文化项目。基金会总部设在著名设计师Wolfgang Joop的旧别墅中。 (图片:HPI.de)
3 个月前
📢 OpenAI即将发布GPT-4.1,多模态能力再升级! 据多家科技媒体报道,OpenAI计划于下周(2025年4月中旬)推出GPT-4.1,作为GPT-4o的升级版本,进一步强化多模态推理能力,并推出轻量级mini和nano版本。 🔍 关键升级点 更强的多模态处理 GPT-4.1将优化对文本、音频、图像的实时处理能力,提升跨模态交互的流畅度。 相比GPT-4o,新模型在复杂推理任务(如视频理解、语音合成等)上表现更优。 轻量化版本(mini & nano) GPT-4.1 mini 和 nano 将面向不同应用场景,降低计算资源需求,适合移动端或嵌入式设备。 配套新模型(o3 & o4 mini) OpenAI还将推出o3推理模型(满血版)和o4 mini,优化特定任务性能。 部分代码已在ChatGPT网页端被发现,表明发布临近。 ⏳ 发布时间与不确定性 原定下周发布,但OpenAI CEO Sam Altman 曾预警可能因算力限制调整计划。 同期,ChatGPT已升级长期记忆功能,可回顾用户历史对话,提供个性化服务(Plus/Pro用户已开放)。 🌍 行业影响 谷歌(Gemini AI)和微软(Copilot)近期也强化了AI记忆功能,竞争加剧。 GPT-4.1可能进一步巩固OpenAI在多模态AI领域的领先地位,推动商业应用(如智能客服、内容创作等)。 📌 总结:GPT-4.1的发布标志着OpenAI在多模态AI上的又一次突破,但具体性能提升和落地效果仍需观察。我们将持续关注官方更新! (综合自腾讯新闻、The Verge、搜狐等)
3 个月前
人工智能是汉诺威工业展上的主导主题 微软正在推出创新助手,旨在显著简化工厂的工作流程。在近日开幕的2025汉诺威工业博览会上,微软展示了可广泛应用于工业领域的具有人工智能的创新虚拟助手。该软件公司在此次展会上展示的新产品之一是“工厂运营代理”(Factory Operations Agent)。 据该公司介绍,这是一个人工智能助手,旨在优化工厂车间的流程。例如,该解决方案使工人能够通过使用自然语言查询来分析机器的数据。 “负责任的经理”将能够优化制造流程。人工智能助手还可以比以前更轻松地识别错误来源并解决问题。 微软德国公司董事总经理阿格尼丝·赫夫伯格在汉诺威工业博览会开幕式上表示,人工智能已经走出了测试和实验阶段,正在工业领域得到广泛应用。 “我们必须毫不犹豫地引入人工智能,否则德国将在国际竞争中落后。我们必须让数据宝藏为人工智能所用。” 德国人工智能已经存在 根据德国数字协会Bitkom的一项代表性调查,42%的德国工业企业已经在生产中使用人工智能,另有三分之一(35%)有相应计划。其中包括机器的监控、机器人和车辆的控制以及能源消耗的优化:这项调查是在德国 552 家拥有 100 名或更多员工的工业制造公司中进行的。82%的公司认同人工智能的使用对于德国工业的竞争力至关重要。 然而,近一半(46%)的人认为德国工业界可能会错过人工智能革命。微软与谷歌、Meta、亚马逊并列成为全球领先的人工智能系统提供商,部分原因是微软首席执行官萨蒂亚·纳德拉早期投资数十亿美元与加州人工智能初创公司OpenAI及其开发的聊天机器人ChatGPT进行全面合作。 (资讯来源: tagesschau.de)
3 个月前
这项研究由科布伦茨应用科学大学和波恩大学医院的医学研究人员团队完成,他们开发了一种名为 OptAB 的 AI 模型,用于个体化和优化地选择治疗败血症的抗生素。该模型完全基于 AI 数据驱动,并特别注重在考虑副作用的情况下,为败血症患者选择最合适的抗生素。其目标是最大化治疗成功率,同时显著降低治疗过程中的副作用。 此外,这一研究得到了莱法州卫生部门的资助,并被认为是首个能够为败血症患者提供个性化抗生素优化选择的在线模型。由于败血症治疗开始时病原体通常未知,医生常常依赖广谱抗生素,而 OptAB 模型可以通过分析患者的临床数据、病原体信息及药物敏感性,帮助医生快速制定更精准的治疗方案。相关成果已发表在医学期刊《npj·digital medicine》上。 据开发人员称,该 AI 模型是使用历史败血症病例的数据创建的,是世界上第一个此类 AI 模型。找到正确的药物组合来治疗败血症可以大大增加康复的机会,并消除对可能导致严重副作用的广谱药物治疗的需求。 (资讯来源:德国联邦外贸与投资署)
4 个月前
delphi GmbH 是一家成立于 2001 年的德国创新型企业,总部位于德国,专注于健康促进和预防领域。自创立以来,公司从最初的药物滥用预防和咨询服务起步,逐步发展为一家将科学研究、数字化技术与实践应用相结合的行业先锋。近年来,delphi GmbH 在人工智能(AI)领域的投入尤为突出,其标志性项目之一——SuchtGPT,充分展示了公司在健康服务中应用AI的雄心与能力。 公司概况与核心业务 delphi GmbH 的使命是通过科学方法和创新手段提升人们的健康与福祉。公司业务涵盖在线咨询与干预项目、项目评估与研究、健康信息传播以及创新项目开发。其团队由心理学、公共健康、社会工作等领域的专家组成,强调将理论知识转化为实际解决方案。服务的客户包括公共机构和私营企业,业务范围覆盖德国及相关合作网络。 delphi 的核心价值体现在四个方面:科学性(以实证研究为基础)、实用性(贴近实际需求)、数字化(利用现代技术接触广泛人群)以及合作性(与客户共同制定策略)。这些理念不仅贯穿其传统健康服务,也为其AI相关业务奠定了基础。 AI业务:SuchtGPT 项目 在人工智能领域,delphi GmbH 的代表性项目是 SuchtGPT(“Gestaltung, Programmierung und Testung eines KI-basierten Chatbots für Suchtfragen” 的缩写,意为“设计、编程和测试用于毒瘾问题的AI聊天机器人”)。该项目由德国联邦卫生部(Bundesministerium für Gesundheit, BMG)资助,旨在开发一个基于AI的聊天机器人,为用户提供毒瘾相关问题的低门槛、匿名支持。 SuchtGPT 的目标是通过一个符合欧盟数据保护标准(DSGVO-konform)的数字化工具,帮助用户获取信息或引导他们进入专业戒毒体系。项目利用大型语言模型(Large Language Model, LLM),结合毒瘾领域的专业知识和沟通技巧,使聊天机器人能够独立、准确地回答用户提问。开发过程采用参与式方法,广泛吸纳毒瘾救助领域的利益相关者(如专业协会、戒毒机构和政策制定者)的意见,确保工具的实用性。 项目实施分为多个阶段:前期技术框架搭建与背景研究、原型开发与测试、以及基于数据分析的持续优化。截至 2025 年 3 月,SuchtGPT 仍处于开发阶段。2025 年 1 月 15 日,项目团队举办了一场数字化信息活动,向超过 250 名参与者展示了项目规划和生成式AI的应用成果。更多进展可通过其官网跟踪。 AI与健康服务的融合 SuchtGPT 项目不仅体现了 delphi 在AI技术上的投入,也延续了其在数字化健康服务领域的专长。公司通过在线咨询平台、健康教育工具等积累了丰富的经验,而 AI 的引入进一步扩展了服务的广度和深度。例如,SuchtGPT 的聊天机器人旨在以更高效、智能的方式触达需要帮助的人群,同时保持服务的科学性和可靠性。这种将AI与健康促进相结合的模式,凸显了 delphi 在行业中的前瞻性。 团队与合作伙伴 delphi 的 AI 项目由一支跨学科团队推动,成员包括心理学专家、技术开发人员和数据分析师。在 SuchtGPT 项目中,公司与 nexus Institut 等合作伙伴协作,负责参与流程的执行,同时依托 IT 与 AI 专家确保技术实现的高标准。这种合作模式也反映了 delphi 一贯强调的“协作性”理念。 总结 delphi GmbH 是一家在健康促进领域深耕多年的德国企业,以科学性与实用性著称。近年来,公司通过 SuchtGPT 等项目,积极探索人工智能在健康服务中的应用,致力于为毒瘾等问题提供创新、数字化的解决方案。凭借其专业团队和与时俱进的技术战略,delphi 在德国乃至全球的健康科技领域占据了重要地位。 这家企业不仅是健康促进的践行者,更是 AI 技术在公共福祉领域应用的先锋。未来,随着项目的推进,delphi 的影响力有望进一步扩大。 (信息来源:dephi官网)
4 个月前
德国Comarch ERP Enterprise 是一款全面的企业资源规划 (ERP) 系统,专为寻求在流程方面提高 ERP 系统用户技术进步水平的企业而设计。它是一款现代化的 ERP 系统,具有高度的灵活性和可扩展性,能够满足各种规模和行业的企业的需求。 Comarch企业软件公司最近撰文:“ChatERP: Quantensprung im Enterprise-Resource-Planning”,即ChatERP在企业资源规划中的巨大进步。这份白皮书提到ERP系统是企业的核心,整合了关键业务流程和数据。过去,AI在ERP中的应用成本高且复杂,主要适用于大企业。但生成式AI和大型语言模型(如ChatGPT)的出现改变了这一状况,使得中小企业也能利用AI提升竞争力。这里的关键点是生成式AI降低了使用门槛,使得ERP中的AI助手变得可行。 1. 引言与背景 ERP系统的重要性:作为企业核心,整合关键业务流程(生产、采购、销售等)及数据(客户、订单、库存等)。AI在ERP中的演变:传统AI(如机器学习)成本高、数据需求大,仅适用于大企业;生成式AI(如ChatGPT)通过大型语言模型(LLM)降低门槛,使中小企业也能利用AI提升竞争力。ChatERP的定位:Comarch ERP Enterprise(6.4+版本)内置的多语言AI助手,通过自然语言交互革新ERP使用方式。 2. 改善可用性与降低使用障碍 自然语言交互:用户可通过对话形式与ERP系统互动,支持多语言,会话上下文感知。 动态帮助系统:基于RAG(检索增强生成)技术,AI助手深度理解ERP系统细节,无需额外训练。替代静态文档,提供实时、步骤化指导(如创建新文章、导航功能)。 降低学习成本:新用户快速上手,缩短培训时间;有经验用户更快掌握新功能。减少对IT支持的依赖,释放IT团队资源用于创新任务。 3. 通过语音/文本命令高效控制应用 多模态交互:支持传统UI操作与语音/文本指令结合,提升效率。应用场景: 快速导航:直接跳转深层功能(如“打开分类为家居用品的文章”)。数据操作:创建/打开记录(如“为Mustermann公司新建订单”并预填数据)。自动化任务:处理重复性工作(数据清理),但关键操作需人工审核。 类似消费级助手(如Siri):但针对企业复杂场景优化,通过API集成ERP功能。 4. 通过聊天探索ERP数据价值 数据查询与分析: 自然语言生成报告(如“显示上季度各地区销售额”),自动生成图表或摘要。预测与洞察:销售趋势预测、库存优化建议。 降低数据分析门槛:非技术用户无需复杂技能即可获取业务洞察,支持数据驱动决策。 5. 安全与合规 权限管理:通过架构设计确保数据访问合规性(如Berechtigungen权限控制)。数据隐私:企业数据仅用于内部处理,符合GDPR等法规。 6. 实施建议与结论 采用策略: 选择兼容现有系统的AI助手(如ChatERP),分阶段部署,从小任务开始。培训员工适应新交互方式,结合传统与AI操作以最大化效率。 未来潜力: 持续优化AI模型,扩展应用场景(如供应链优化、客户行为分析)。推动ERP从“记录系统”向“智能决策支持系统”转型。 核心价值总结: ChatERP通过自然语言交互、动态帮助、语音控制及智能数据分析,显著提升ERP系统的易用性、效率和决策支持能力,尤其助力中小企业以更低成本实现数字化转型。
4 个月前
BERT(Bidirectional Encoder Representations from Transformers)是由Google于2018年发布的一种预训练语言模型,基于Transformer架构,用于自然语言处理(NLP)任务。它的双向(Bidirectional)上下文理解能力使其在文本理解、问答系统、文本分类等任务中表现卓越。 BERT的核心特点 1. 双向上下文理解 传统语言模型(如GPT)通常是单向的(从左到右或从右到左)。 BERT采用Masked Language Model(MLM,掩码语言模型),即在训练过程中随机遮挡部分词语,并让模型根据上下文预测这些被遮挡的词,从而实现双向理解。 2. 预训练+微调(Pre-training & Fine-tuning) 预训练(Pre-training):在海量无标注文本数据(如维基百科、BooksCorpus)上进行训练,使BERT学会通用的语言知识。 微调(Fine-tuning):针对具体任务(如情感分析、问答系统、命名实体识别)进行轻量级训练,只需少量数据,即可获得良好效果。 3. 基于Transformer架构 BERT使用多层Transformer编码器,通过自注意力(Self-Attention)机制高效建模文本中的远程依赖关系。 Transformer结构相比RNN和LSTM,更适合并行计算,处理长文本能力更强。 BERT的两大核心任务 Masked Language Model(MLM,掩码语言模型) 在训练时,随机遮挡输入文本中的15%单词,让模型根据上下文预测这些词。 这种方法使BERT学习到更深层次的语言表示能力。 Next Sentence Prediction(NSP,下一句预测) 让模型判断两个句子是否是相邻句: IsNext(相关):句子A和B是原始文本中相连的句子。 NotNext(无关):句子B是随机选择的,与A无关。 这一任务有助于提高BERT在问答、阅读理解等任务中的能力。 BERT的不同版本 BERT-Base:12层Transformer(L=12)、隐藏层768维(H=768)、12个自注意力头(A=12),总参数110M。 BERT-Large:24层Transformer(L=24)、隐藏层1024维(H=1024)、16个自注意力头(A=16),总参数340M。 DistilBERT:更小更快的BERT变体,参数量约为BERT的一半,但性能接近。 RoBERTa:改进版BERT,去除了NSP任务,并采用更大数据量进行训练,提高了性能。 BERT的应用 BERT可以应用于多种NLP任务,包括: 文本分类(如垃圾邮件检测、情感分析) 命名实体识别(NER)(如人名、地名、组织识别) 阅读理解(QA)(如SQuAD问答) 文本摘要 机器翻译 搜索引擎优化(SEO)(Google已将BERT用于搜索算法) BERT的影响 推动NLP进入预训练时代:BERT的成功引发了NLP领域的“预训练+微调”范式(如GPT、T5、XLNet等)。 提升搜索引擎性能:Google 在搜索引擎中使用BERT,提高查询理解能力。 加速AI技术发展:BERT的开源推动了自然语言处理技术在学术界和工业界的广泛应用。 总结 BERT是Transformer架构的双向预训练模型,通过MLM和NSP任务学习通用语言知识,在NLP领域取得巨大突破。它的成功奠定了现代大模型预训练+微调的范式,被广泛用于搜索、问答、文本分类等任务。
Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。
海螺AI