logo AI平台
  • 首页
  • AI简讯
    • 国内
    • 国际
  • AI技术
    • 机器学习
    • 深度学习
    • 神经网络
    • 语言模型
    • 语音视觉
    • 机器人
    • 智能体
    • 流程智能化
  • AI硬件
    • 计算核心
    • 语音视觉
    • 传感器
    • 智能终端
    • 智能机器人
  • AI教培
    • 教育
    • 培训
    • 会议
    • 观点
    • 专家
  • AI百科
  • 合作咨询
  • AI工具收录
  • 登录

  • 本站
  • 必应
  • 百度
  • 谷歌
  • 360搜索
OpenClaw 本地 图像工具 市场调研 AI桌面 AI社区 AI记忆
  1. 首页
  2. AI技术
  3. 语音视觉
  • YOLO 计算机视觉目标监测算法
    语音视觉

    YOLO 计算机视觉目标监测算法

    YOLO(You Only Look Once),这确实是目前计算机视觉领域最热门、应用最广泛的目标检测算法之一。 简单来说,如果把计算机看作一个学生,传统的检测算法像是让学生“拿着放大镜,一点点扫描图片里有什么”,而 YOLO 则是让学生...

    管理员 4 个月前 534
  • 阶跃星辰开源两款多模态模型 -- Step - Video - T2V 和 Step - Audio
    语音视觉

    阶跃星辰开源两款多模态模型 -- Step - Video - T2V 和 Step - Audio

    2月18日,阶跃星辰联合吉利汽车集团开源了两款阶跃Step系列多模态大模型——Step - Video - T2V视频生成模型和Step - Audio语音模型,采用MIT协议,支持免费商用、任意修改和衍生开发。 两款模型的具体信息如下: ...

    管理员 1 年前 1048
  • Adobe推出全新 AI 视频生成工具:Firefly Video Model
    语音视觉

    Adobe推出全新 AI 视频生成工具:Firefly Video Model

    Adobe 最近推出了全新的 AI 视频生成工具 Firefly Video Model,这一工具旨在通过人工智能技术帮助用户快速生成高质量的视频内容。以下是关于该工具的主要功能和特点: 1. 核心功能 Firefly Video Mod...

    管理员 1 年前 1016
  • CovisionLab:工业领域的计算机视觉和机器学习
    语音视觉

    CovisionLab:工业领域的计算机视觉和机器学习

    Covision Lab专注于计算机视觉和机器学习的公司,致力于将最先进的技术应用于工业领域的挑战,包括制造业、电子商务、印刷、农业和移动性等行业。...

    管理员 1 年前 385
  • AI 视频生成模型的主要技术原理是什么 ?
    语音视觉

    AI 视频生成模型的主要技术原理是什么 ?

    AI视频生成模型的主要技术原理包括多种深度学习和机器学习技术,尤其是生成对抗网络(GANs)、变分自编码器(VAEs)和自然语言处理(NLP)。...

    管理员 1 年前 1163
  • 以文字为内容的图片生成工具
    语音视觉

    以文字为内容的图片生成工具

    本文推荐了想为博客网站制作插图,特别是以文字为主的插图图片制作工具。...

    管理员 1 年前 463
  • fal.ai 让生成式AI减少人类创意表达的障碍
    语音视觉

    fal.ai 让生成式AI减少人类创意表达的障碍

    Fal.ai通过为生成模型提供最快的推理,使开发人员能够创建响应式、沉浸式且经济高效的体验。...

    管理员 1 年前 692
  • 复制CodeFormer指南
    语音视觉

    复制CodeFormer指南

    复制 Codeformer 涉及几个步骤,包括收集大量代码和自然语言对的数据集、预处理数据以及微调转换器模型。有几种开源工具和库可用于帮助完成这些任务,包括 Hugging Face 的 Transformers 库,它提供了预先训练的转换...

    管理员 1 年前 380
  • 通义开源语音基座大模型:SenseVoice和CosyVoice
    语音视觉

    通义开源语音基座大模型:SenseVoice和CosyVoice

    通义语音团队开源了语音基座大模型:SenseVoice和CosyVoice。...

    管理员 1 年前 1892
  • 英伟达AI创新应用:从数字人类构建、生成式AI集成、到药物发现模拟
    语音视觉

    英伟达AI创新应用:从数字人类构建、生成式AI集成、到药物发现模拟

    英伟达在AI和计算领域的多项创新应用与解决方案,涵盖了从数字人类构建、生成式AI集成、到药物发现模拟等多个方面。...

    管理员 1 年前 420
  • Motiff 妙多发布 UI 设计大模型
    语音视觉

    Motiff 妙多发布 UI 设计大模型

    Motiff 妙多大模型是全球首个由 UI 设计工具企业研发的大模型。...

    管理员 1 年前 834
  • Seed-TTS: 字节推出高质量多功能语音生成模型
    语音视觉

    Seed-TTS: 字节推出高质量多功能语音生成模型

    Seed-TTS:一种高质量多功能语音生成模型...

    管理员 1 年前 753
  • DALL·E 2和DALL·E 3的区别
    语音视觉

    DALL·E 2和DALL·E 3的区别

    DALL·E 2可以根据文本生成图像以及对现有图像进行编辑等。DALL·E 3相比DALL·E 2在生成的图像质量、对提示词的理解、上下文理解、处理复杂任务等方面有提升。...

    管理员 1 年前 1643
  • Meta开源新一代”SAM2”视频分割新技术
    语音视觉

    Meta开源新一代”SAM2”视频分割新技术

    Meta推出了其 “分割一切AI” 的第二代——SAM2,不仅能实时处理任意长度的视频,连视频中从未见过的物体也能轻松分割追踪。...

    管理员 1 年前 606
  • 语音视觉智能中的关键技术
    语音视觉

    语音视觉智能中的关键技术

    语音视觉技术是一种结合了语音识别和计算机视觉的交叉学科技术,通过分析和理解人类语言以及视觉信息,实现人机交互和智能处理。...

    管理员 1 年前 379
  • 语音视觉技术在人工智能领域的应用
    语音视觉

    语音视觉技术在人工智能领域的应用

    AI 中的语音视觉技术是人工智能领域的重要组成部分。语音技术包括语音识别、语音合成、声纹识别等子领域。例如,语音识别技术能将人类语音信号转换成对应的文本或命令,如今已广泛应用于语音助手、自动驾驶、智能家居等领域。像苹果的 Siri 可以通过...

    管理员 1 年前 439
  • 语音视觉技术简介
    语音视觉

    语音视觉技术简介

    语音视觉技术在教育、医疗、交通、娱乐等多个领域的应用将越来越广泛,为人们的生活和工作带来更多的便利和创新。...

    管理员 1 年前 477
  • PaddleOCR文字识别模型
    语音视觉

    PaddleOCR文字识别模型

    PaddleOCR 是基于飞桨深度学习开源框架的文字识别开发套件,添加了许多 PaddleOCR 算法模型挑战赛冠军方案。 PaddleOCR目前不仅提供了通用场景下的中英文模型,也提供了专门在英文场景下训练的模型。除此之外也提供覆盖80个...

    管理员 1 年前 458
  • 英伟达Nvidia Omniverse:提供API和SDK的服务平台
    语音视觉

    英伟达Nvidia Omniverse:提供API和SDK的服务平台

    NVIDIA Omniverse™ 提供 API和SDK , 开发者可以轻松地将通用场景描述 (OpenUSD) 和 RTX 渲染技术集成到现有软件工具和仿真工作流中,以构建 AI 系统。...

    管理员 1 年前 596
  • 视频生成|视频编辑|视频营销工具:InVideo
    语音视觉

    视频生成|视频编辑|视频营销工具:InVideo

    InVideo 是一款适合任何技能水平用户的完美 AI 视频创建器和编辑器。借助现成的模板,可快速轻松地自定义视频。...

    管理员 1 年前 710

帮你写代码、读文件、写作各种创意内容

分类

  • AI简讯
    7
    • 国内
      20
    • 国际
      76
  • AI+行业
    22
    • 智能家居
      3
    • 艺术娱乐
      12
    • 健康医疗
      22
    • 人力资源
      9
    • 金融科技
      13
    • 法律服务
      8
    • 工业制造
      27
    • 能源能效
      9
    • 仓储物流
      6
    • 市场分析
      15
    • 环境气候
      4
    • 安全监控
      3
  • AI技术
    48
    • 机器学习
      11
    • 深度学习
      9
    • 神经网络
      5
    • 语言模型
      77
    • 语音视觉
      20
    • 机器人
      3
    • 智能体
      6
    • 流程智能化
      8
  • AI硬件
    0
    • 计算核心
      20
    • 语音视觉
      1
    • 传感器
      5
    • 智能终端
      13
    • 智能机器人
      14
  • AI教培
    1
    • 教育
      19
    • 培训
      2
    • 会议
      9
    • 观点
      10
    • 专家
      15
  • AI百科
    53

热门文章

  • 1
    豆包推荐9个国外AI工具平台网站
    1.05万 浏览量
  • 2
    AI比较:基于API调用费用的10大语言大模型价格比较
    0.97万 浏览量
  • 3
    介绍10个法律AI应用工具
    0.71万 浏览量
  • 4
    杭州AI“六小龙”是哪6家公司?
    0.7万 浏览量
  • 5
    蚂蚁集团百灵大模型HI
    0.61万 浏览量
  • 6
    字节跳动:云雀模型
    0.57万 浏览量
  • 7
    开发AI聊天工具的6个开源项目
    0.53万 浏览量
  • 8
    千问启用全新AI Chat域名及界面:chat.qwen.ai
    0.51万 浏览量
  • 9
    字节跳动旗下豆包和小悟空两款AI应用工具的区别
    0.47万 浏览量
  • 10
    海光DCU算力加速卡
    0.47万 浏览量

最新评论

  • minimax
    minimax 12 个月前
    Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。

标签

AI平台
为AI创作者提供绘画创作、智能对话、翻译辅助、3D设计、视频生成、语言合成等1000+ AI 工具和 AI 资讯信息。

探索分类

  • 对话聊天
  • 图像工具
  • 设计工具
  • 音频工具
  • 视频工具

快捷链接

  • 最新资源
  • 热门推荐
  • RSS订阅

关注我们

© 2026 AI平台. All Rights Reserved.
sitemap
× Enlarged