谷歌首个原生多模态嵌入模型Gemini Embedding 2发布
创始人
2026-03-12 04:50:04
0

IT之家 3 月 11 日消息,北京时间今天凌晨,谷歌发布了全新 Gemini Embedding 2 模型。这是谷歌首个原生多模态嵌入模型,可以把文本、图像、视频和文档映射到同一个嵌入空间。

嵌入模型与生成式模型不同。Gemini 3 等生成式模型主要用于生成内容,而嵌入模型用于理解数据。嵌入模型会把文本、图像或视频转换为向量等数学形式,方便机器读取和分析。

通过语义搜索、分类和聚类等方式,此类模型可以理解语义关系,因此往往比传统关键词检索提供更准确、更具上下文的信息。

据IT之家了解,谷歌最早推出的 Embedding 模型只支持文本。Gemini Embedding 2 则支持文本、图像、视频、音频和文档,并能在 100 种语言中识别语义意图。

不同数据类型的处理限制如下:

  • 文本:上下文窗口最高 8192tokens
  • 图像:每次请求最多 6 张,支持 PNG 和 JPEG 格式
  • 视频:最多 120 秒输入,支持 MP4 和 MOV 格式
  • 音频:可直接处理音频数据,无需先进行转录
  • 文档:支持最多 6 页 PDF

谷歌在博客中表示,新模型可以简化复杂的数据处理流程,同时增强多模态应用能力。应用场景包括检索增强生成(RAG)、语义搜索、情感分析以及数据聚类

模型还可以在一次请求中同时接收“图像 + 文本”等类型的多种输入,从而分析不同媒体类型之间的关系。

谷歌举例说,在诉讼取证阶段,Gemini 嵌入模型可以帮助法律专业人士快速找到关键证据。测试结果显示,在数百万条记录中,多模态嵌入能够提升检索精度和召回率,同时改善图像与视频搜索效果。

Gemini Embeddings 2(gemini-embedding-2-preview)目前已经通过 Gemini API 和 Vertex AI 提供公开预览。与此同时,gemini-embedding-001 仍然可用于只处理文本的应用场景。

相关内容

热门资讯

如何选择靠谱的zeta电位分析... zeta电位分析仪的重要性 zeta电位分析仪在科研和工业生产中意义重大。在制药领域,它能帮助控制药...
锦浪科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示锦浪科技(300763)新获得一项发明专利授权,专利名为“一种...
锦浪科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示锦浪科技(300763)新获得一项发明专利授权,专利名为“一种...
江淮汽车获得发明专利授权:“基... 证券之星消息,根据天眼查APP数据显示江淮汽车(600418)新获得一项发明专利授权,专利名为“基于...
又是超百股涨停,半导体等板块领... 扬子晚报网5月12日讯(记者 范晓林)今天是周二,昨天福达合金5连板,大唐发电4连板,红板科技、泰晶...
长光华芯取得半导体结构制备方法... 国家知识产权局信息显示,苏州长光华芯光电技术股份有限公司;苏州长光华芯半导体激光创新研究院有限公司取...
费城半导体指数跌幅扩大至6% 每经AI快讯,美股芯片与半导体设备板块周二普遍回落,费城半导体指数跌幅扩大至6%。 每日经济新闻
半导体设备ETF国泰(1595... A股市场整体温和调整,上证指数收跌0.25%,创业板指微收涨0.15%;在此背景下,半导体设备ETF...
晶合集成获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示晶合集成(688249)新获得一项发明专利授权,专利名为“一种...
夫妻囤存储芯片5个月狂涨320... AI浪潮,将一对深圳夫妻推至巅峰。5月11日,德明利董事长李虎带队召开业绩发布会,直言“行业景气度高...