OpenAI Responses APIが現地時間の3月11日に公開されました。エージェント指向のAPIということで、より実用的なアプリが作りやすくなり、いわばAIエージェントへの布石とも言えるでしょう。 この記事ではAPIの解説と、実際に自分で作って動かしてみた結果を ...
「OpenAI APIをPythonで使ってみたいけど、エラーが出たらどうしよう…そもそも何から始めればいいの?」そう思う方もいるかもしれません。実は、OpenAI APIをPythonで扱うには、基本的な使い方とよくあるエラーの対策、この2つを押さえるだけでスムーズに ...
杉田 (@ane45) です。2024年12月の 「Python Monthly Topics」 は、OpenAIの音声認識モデルWhisperをPythonから使用する方法を解説します。さらに、Whisperモデルを基にした派生ツールやライブラリであるwhisper. cpp、faster-whisper、mlx-whisperについても紹介します。 Whisperとは ...
大規模言語モデル(LLM)が得意なタスクは、大きく分けて要約・推論・変換・拡張の四分野に分けられる。それで、文章を要約したり翻訳したりするのは、LLMの得意なタスクだ。それで、筆者もよく翻訳や要約にChatGPTを利用している。 とは言え、専用ツールが ...
何かと話題の対話型AIであるChatGPTだけれども、その開発元であるOpenAIが提供しているサービス・機能はChatGPT以外にもいくつかある。その1つが「Whisper」という音声データから文字起こししてくれる機能だ。 筆者の場合、たとえば取材のときに録音し、それを ...
Mozillaが単一インターフェースで複数のAIを使用可能にするGo言語向けライブラリ「any-llm-go」を2026年2月10日にリリースしました。
何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近 ...
Azure OpenAI Service(以下Azure OpenAI)は、2023年1月に一般提供が開始されたMicrosoft版のOpenAIサービスだ。GPT-3やChatGPT(GPT-3.5 Turbo)などの大規模言語モデル(LLM)をAzureプラットフォーム上で利用できる。少々、利用申請に戸惑ったが、それらを含め使用感を ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する