View in English

  • メニューを開く メニューを閉じる
  • Apple Developer
検索
検索を終了
  • Apple Developer
  • ニュース
  • 見つける
  • デザイン
  • 開発
  • 配信
  • サポート
  • アカウント
次の内容に検索結果を絞り込む

クイックリンク

5 クイックリンク

ビデオ

メニューを開く メニューを閉じる
  • コレクション
  • トピック
  • すべてのビデオ
  • 利用方法

WWDC19に戻る

ストリーミングはほとんどのブラウザと
Developerアプリで視聴できます。

  • 概要
  • トランスクリプト
  • 音声認識の最新情報

    Speech Recognizerを、ネットワーク接続がなくても、iOSまたはmacOSデバイスでローカルに使用できようになりました。このセッションでは、プライバシーを保護し、サーバベースの処理における制限を排除しながら、Appをテキストから音声への変換に対応させる方法について説明します。また、音声認識のAPIが、話す速さ、休止の長さ、音声の品質など、より豊富な分析が行えるよう強化されたことについてもご確認いただけます。

    リソース

    • Recognizing speech in live audio
      • HDビデオ
      • SDビデオ
    • プレゼンテーションスライド(PDF)

    関連ビデオ

    WWDC23

    • デバイス上の音声認識のカスタマイズ

    WWDC19

    • 機械学習における新機能
    • Core ML 3フレームワーク
    • Core MLとARKitを使用して優れたAppを作成する

    WWDC16

    • Speech Recognition API
  • このビデオを検索

    (音楽)

    音声認識を担当する ソフトウェア・エンジニアのネーハです 私たちは2016年に― 音声認識のフレームワークを デベロッパ向けに紹介しました そちらをご存じない方は― ヘンリー・メイソンによる 過去のAPIセッションをご覧ください

    今回はAPIの改良点について お話しします 始めましょう

    macOSでは音声認識が サポートされていますが― AppKitとiPadの アプリケーションでも可能です iOS同様 50言語以上を サポートしています

    マイクにアクセスし 録音をするには ユーザの承認を受け― Siriを有効にしておく必要があります

    macOSの音声認識を さらにサポートするため― プライバシーを考慮して オンデバイスでの処理を可能にしました

    その際 ユーザのデータは AppleのServerに送られません

    ネットワークにつなぐ必要もなく― モバイルデータ通信も使いません

    しかし その裏には代償もあります 継続的な学習ができるため 精度はServerのほうが高いのです Serverベースの認識サポートには リクエスト数と時間に制限があります オンデバイスでは これらの制限がありません カバーする言語も Server上のほうが多いです Serverが使えない際― サポートされている端末は自動的に オンデバイス認識へ切り替わります Apple A9以降のプロセッサを搭載する iPhoneやiPadを含め― Mac製品は すべてサポートされています 10言語以上がオンデバイスで サポートされます

    オンデバイスの認識に コードは どう用いるのでしょう? 前に録音した音声を認識するには SFSpeechRecognizer objectを作成し― まず音声認識が可能かを確認します

    音声認識が可能なら― 音声ファイルのURLを使って 要求を作成し 認識を開始できます

    オンデバイス認識を使用するには サポートされているかを確認し― requiresOnDeviceRecognitionを リクエストします

    同じコードが確認できたら 準備は完了です

    iOS 10では音声認識結果として 次のようなものがありました トランスクリプション 代替解釈 信頼水準 タイミングの情報などです

    今回は音声認識から得られる結果を 増やしました

    Speaking rateは 人が1分当たりに話す速度です

    Average pause durationは 言葉の間隔をどれだけ開けるかです

    Voice Analytics featuresでは あらゆる声の特徴を判断します

    この分析では4つの特徴に注目します 音の高さを表すJitterでは― 発話をパーセンテージの形で表します 音の振れ幅を表すShimmerは― 発話をデシベルの形で表示します

    JitterとShimmerの数値が高い音声を 聞き比べましょう まずは正常の発声から Apple

    次に不安そうな声です Apple 次のPitchは 声のトーンの高低を計測します 女性や子供は高い傾向にあります Voicingは発声の音域を 特定するものです これらの分析は 個人を特定する際 用いられ― タイミングや状況で変わるものです 例えば対象者が疲れている場合などでも 結果はまったく異なります 誰と話しているかによっても 変わります

    これらは SF transcription objectの一部で― 定期的に利用できるようになります isFinalフラグの送信を待たなくても 見られます speakingRateとaveragePauseDurationに アクセスもできます

    音声分析をするには― SF transcription segment objectに アクセスしてください

    私たちは3つの点で前進しました まずmacOSで音声認識APIを用い アプリケーションを作成できること 音声認識はプライバシーに配慮して オンデバイスで作動できること そして音声の特徴を分析することで― 人の声の分析が可能になったことです

    さらなる情報はwebページで ありがとうございました

Developer Footer

  • ビデオ
  • WWDC19
  • 音声認識の最新情報
  • メニューを開く メニューを閉じる
    • iOS
    • iPadOS
    • macOS
    • tvOS
    • visionOS
    • watchOS
    Open Menu Close Menu
    • Swift
    • SwiftUI
    • Swift Playground
    • TestFlight
    • Xcode
    • Xcode Cloud
    • SF Symbols
    メニューを開く メニューを閉じる
    • アクセシビリティ
    • アクセサリ
    • App Extension
    • App Store
    • オーディオとビデオ(英語)
    • 拡張現実
    • デザイン
    • 配信
    • 教育
    • フォント(英語)
    • ゲーム
    • ヘルスケアとフィットネス
    • アプリ内課金
    • ローカリゼーション
    • マップと位置情報
    • 機械学習
    • オープンソース(英語)
    • セキュリティ
    • SafariとWeb(英語)
    メニューを開く メニューを閉じる
    • 英語ドキュメント(完全版)
    • 日本語ドキュメント(一部トピック)
    • チュートリアル
    • ダウンロード(英語)
    • フォーラム(英語)
    • ビデオ
    Open Menu Close Menu
    • サポートドキュメント
    • お問い合わせ
    • バグ報告
    • システム状況(英語)
    メニューを開く メニューを閉じる
    • Apple Developer
    • App Store Connect
    • Certificates, IDs, & Profiles(英語)
    • フィードバックアシスタント
    メニューを開く メニューを閉じる
    • Apple Developer Program
    • Apple Developer Enterprise Program
    • App Store Small Business Program
    • MFi Program(英語)
    • News Partner Program(英語)
    • Video Partner Program(英語)
    • セキュリティ報奨金プログラム(英語)
    • Security Research Device Program(英語)
    Open Menu Close Menu
    • Appleに相談
    • Apple Developer Center
    • App Store Awards(英語)
    • Apple Design Awards
    • Apple Developer Academy(英語)
    • WWDC
    Apple Developerアプリを入手する
    Copyright © 2025 Apple Inc. All rights reserved.
    利用規約 プライバシーポリシー 契約とガイドライン