
AI와 카메라를 활용한 시각 기술이 다시 새로운 혁신을 가져오고 있습니다. 우리가 무의식적으로 보고 있는 세상의 한 장면을 포착하고 언어화하는 토킹 카메라 앱 〈Seeing AI〉의 Android 버전이 출시되었습니다.
이 앱은 2019년부터 'iOS', 'iPadOS'용으로 서비스가 제공되고 있었으나, 이번 출시로 'Google Play' 스토어에서도 다운로드할 수 있게 되었습니다. 현재 18개 언어를 지원하며, 2024년까지 36개 언어로 확장할 예정입니다.
시각 장애인 지원의 미래로
〈Seeing AI〉는 스마트폰 카메라를 통해 주변 풍경을 인식하고 음성으로 정보를 제공합니다. 이를 통해 시각 장애인이 이메일을 읽거나, 상품을 인식하거나, 사진 설명을 음성으로 들을 수 있도록 지원합니다.
〈Microsoft〉의 Cognitive Services를 활용하여 실시간으로 대상물의 결과를 즉시 표시할 수 있습니다. 이를 통해 시각 장애인들은 스마트폰을 통해 실시간으로 세상에 접근할 수 있게 됩니다.

© Microsoft
AI 기술을 활용한 인지 능력을 기반으로 시각 정보를 음성으로 변환하는 〈Seeing AI〉는 문자, 문장, 바코드, 인물, 풍경, 화폐, 색상, 빛 등을 인식하는 기능을 갖추고 있으며, 특히 '짧은 텍스트', '인물', '색상', '빛' 등의 정보 인식 기능은 오프라인에서도 사용할 수 있습니다. 또한, 이 앱에는 〈OpenAI〉의 〈ChatGPT〉를 활용한 새로운 기능도 구현되어, 문서의 문자 인식 결과를 〈ChatGPT〉로 분석할 수 있게 되었습니다.
인지 장치로서의 사진
이것은 기존의 사진이 주로 기록 장치로 인식되었던 틀을 넘어섭니다. 〈Seeing AI〉는 사진의 성질의 변형에 주목하고, 사진을 통해 정보를 인지하는 메커니즘에 주목합니다. 시각 정보를 청각 정보로 변환하는 인지 장치로서, 시각 장애인이 가지고 있던 정보 접근성의 문제를 해결할 것으로 기대됩니다.
접근성에 대한 오랜 노력
〈Microsoft〉는 30년 이상 접근성 관련 서비스를 제공해 왔으며, 이번 〈Seeing AI〉도 그 일환으로 개발되었습니다. 〈Seeing AI〉 앱은 간단하게 만들어져, 눈이 보이지 않아도 사용에 익숙해지면 오류 없이 사용할 수 있으며, 많은 기능이 하나의 앱에 통합되어 있습니다.
이러한 접근성 대응 앱은 시각 장애인이 일상 생활에서 다양한 활동을 지원하고, 그 편리함으로 새로운 사회 참여의 기회를 제공합니다. AI 기술을 활용한 접근성 대응은 시대의 발전과 함께 점점 중요성을 더해가고 있으며, 〈Microsoft〉의 노력은 그 중에서 하나의 돌을 던지고 있습니다. 시각 장애인 지원의 미래를 내다보며, 〈Seeing AI〉는 접근성의 새로운 시대를 열어가고 있습니다.