给年夜模子落地,参加极致的求实主义。DeepSeek 引领的新一轮 AI 技巧暴发才刚开端,剧烈的利用侧竞争也进入了正在停止时。因为官方效劳器常常遭受忙碌、限流等成绩,各家云厂商的 MaaS 效劳正在处理开辟者们的当务之急。自 2 月份以来,各家云科技年夜厂纷纭上线满血版 DeepSeek V3、R1 年夜模子。它们不只卷算力,也竞相供给更便捷的安排计划(从 API 到利用开辟才能),乃至连价钱也卷了起来。3 月 11 日,亚马逊云科技发布 DeepSeek-R1 正式作为全托管的无效劳器模子供给,成为了第一家以全托管通用模子情势供给 DeepSeek-R1 的国际云效劳供给商。

也就是说,无需设置硬件资本,无需设置软件情况皇冠app最新版本下载,一个 API 就能直接挪用满血版 DeepSeek-R1。

应用 Amazon Bedrock Converse API 挪用 DeepSeek-R1 模子天生文本的代码示例,来自:亚马逊云科技消息博客家喻户晓,DeepSeek-R1 是引爆这一轮天生式 AI 技巧暴发的中心。它将强盛的天然言语处置与高等推理才能相联合,机能直接对标 OpenAI o1 并且开源。对开辟者来说,DeepSeek-R1 的高机能跟低本钱为浩繁 AI 利用翻开了新偏向。不外对盼望基于年夜模子构建利用的开辟者跟企业来说,本人安排 671B 参数目的满血版 R1 模子的门槛十分高,最好的方式仍然是应用 API。不外,DeepSeek 官方的 API 远不克不及满意浩繁开辟者的需要,也因而,海内外的 AI 或云效劳商都掀起了一股安排并供给 DeepSeek-R1 效劳的海潮。此中有的供给商采取了供给盘算平台让客户自行安排的方法,也有的会供给包含一键式安排在内的更进一步的安排效劳,而 Amazon Bedrock 为客户供给多种情势的抉择,包含 1 月 30 日开端在其 Marketplace 跟 Custom Model Import 中供给的 DeepSeek-R1 模子支撑以及从本月 11 日开端的全托管式 DeepSeek-R1。固然,这也表现了亚马逊云科技供给多种进步模子,面向差别需要的「Choice Matters」理念。

实考试证:低 TTFT + 高 TPOT这里,基于 Playground,呆板之心对 Amazon Bedrock 的全托管式 DeepSeek-R1 停止了一番实测。起首,先测试一个近来常被用于测试推理跟编程模子的成绩:编写一个演示小球在正十二面体中往返碰撞的 Python 剧本,而且这个小球的色彩会在每次撞击时产生变更。

能够显明留神到,Amazon Bedrock 的全托管式 DeepSeek-R1 的首 Token 时延(TTFT)十分低,这个示例中仅有 0.7 秒 —— 多少乎在咱们点下「运转」按钮之后立刻就开端输出推理 Token 了。同时咱们也能看到输出速率也十分快。咱们也以同样的提醒词在 DeepSeek 官网长进行了两次测试,成果第一次遭受了长达 13 秒的 TTFT,另一次更是在等候近一分钟后只播种了一个「效劳器忙碌,请稍后再试」。至于成果表示,由于 Amazon Bedrock 的全托管式 DeepSeek-R1 是与官网安排的雷同的满血版,以是成果上并不存在显明的差别。至少对这个义务而言,DeepSeek-R1 第一次输出的成果还须要一些 debugging。