
AIとカメラを駆使した視覚技術が、再び新しい革新をもたらしています。普段無意識に見ている世界のワンシーンを切り取り、言語化するトーキングカメラアプリ〈Seeing AI〉にAndroid版が登場しました。
同アプリは2019年より「iOS」「iPadOS」向けにはサービス提供されていたが、今回のリリースを受けて「Google Play」ストアでも入手できるようになった。現在18言語に対応しており、2024年を目処に36言語に拡大する予定です。
視覚障がい者支援の未来へ
〈Seeing AI〉は、スマートフォンのカメラを通じて周囲の風景を認識し、音声で情報を提供します。そのため、視覚に障害のある人がメールを読んだり、商品を認識したり、写真の説明を音声で聞いたりできるよう支援することが可能です。
〈Microsoft〉のCognitive Servicesを活用しており、リアルタイムで対象物の結果を即座に表示できるようになっています。これにより、視覚障がい者の方々はスマートフォンを介してリアルタイムに世界にアクセスできるようになります。

© Microsoft
AI技術を駆使した認知能力を基に視覚情報を音声に転換する〈Seeing AI〉は、文字や文章、バーコード、人物、風景、通貨、色、ライトなどを認識する機能を備え、特に「短いテキスト」、「人」、「色」、「ライト」などの情報認識機能はオフラインでも利用可能です。また、同アプリには〈OpenAI〉の〈ChatGPT〉を活用した新機能も実装され、ドキュメントの文字認識結果を〈ChatGPT〉で解析できるようになっています。
認知装置としての写真
このことは、従来の写真が主に記録装置として捉えられていた枠を超えています。〈Seeing AI〉は、写真の性質の変容に注目し、写真を通じて情報を認知するメカニズムに着目。視覚情報を聴覚情報に変換する認知装置として、視覚障がい者が抱えていた情報のアクセシビリティへの課題を解決することが期待される。
アクセシビリティへの長年の取り組み
〈Microsoft〉は30年以上にわたりアクセシビリティ関連サービスを提供しており、今回の〈Seeing AI〉もその一環として開発されました。〈Seeing AI〉のアプリは簡素に作られ、目が見えなくても操作が慣れれば誤りなく使用可能で、多くの機能が1つのアプリに集約されているいます。
このようなアクセシビリティ対応のアプリは、視覚障がい者が日常生活でのさまざまな活動をサポートし、その利便性により新たな社会参加の機会を提供しています。AI技術を活用したアクセシビリティ対応は、時代の進展とともにますます重要性を増しており、〈Microsoft〉の取り組みはその中で一石を投じています。視覚障がい者支援の未来を見据え、〈Seeing AI〉はアクセシビリティの新たな時代を切り拓いています。