magazine
2024.09.04

Ứng dụng máy ảnh AI đọc văn bản <Seeing AI> | Release #44

2023-12-seeing-ai-cover-image

Công nghệ thị giác sử dụng AI và máy ảnh đang mang đến những đổi mới mới. Phiên bản Android của ứng dụng máy ảnh đọc văn bản đã ra mắt, giúp chuyển đổi các cảnh trong thế giới mà chúng ta thường không để ý thành ngôn ngữ.

Ứng dụng này đã được cung cấp cho "iOS" và "iPadOS" từ năm 2019, nhưng giờ đây cũng có sẵn trên cửa hàng "Google Play". Hiện tại, ứng dụng hỗ trợ 18 ngôn ngữ và dự kiến sẽ mở rộng lên 36 ngôn ngữ vào năm 2024.

Hướng tới tương lai hỗ trợ người khiếm thị

nhận diện cảnh quan xung quanh thông qua camera của điện thoại thông minh và cung cấp thông tin bằng giọng nói. Điều này giúp người khiếm thị có thể đọc email, nhận diện sản phẩm, và nghe mô tả ảnh bằng giọng nói.

Ứng dụng sử dụng dịch vụ Cognitive của để hiển thị kết quả đối tượng trong thời gian thực, giúp người khiếm thị truy cập thế giới thông qua điện thoại thông minh trong thời gian thực.

2023-12-seeing-ai-image-6

chuyển đổi thông tin thị giác thành âm thanh dựa trên khả năng nhận thức sử dụng công nghệ AI, với khả năng nhận diện văn bản, mã vạch, con người, cảnh quan, tiền tệ, màu sắc, ánh sáng, và nhiều hơn nữa. Đặc biệt, các chức năng nhận diện thông tin như "văn bản ngắn", "người", "màu sắc", "ánh sáng" có thể sử dụng ngoại tuyến. Ngoài ra, ứng dụng còn có tính năng mới sử dụng của , cho phép phân tích kết quả nhận diện văn bản tài liệu bằng .

Ảnh như một thiết bị nhận thức

Điều này vượt qua khung của ảnh truyền thống chỉ được coi là thiết bị ghi lại. chú ý đến sự biến đổi của tính chất ảnh và cơ chế nhận thức thông tin qua ảnh. Là một thiết bị nhận thức chuyển đổi thông tin thị giác thành thông tin thính giác, ứng dụng này được kỳ vọng sẽ giải quyết các vấn đề về khả năng tiếp cận thông tin mà người khiếm thị gặp phải.

Nỗ lực lâu dài cho khả năng tiếp cận

đã cung cấp các dịch vụ liên quan đến khả năng tiếp cận trong hơn 30 năm, và được phát triển như một phần của nỗ lực này. Ứng dụng được thiết kế đơn giản, dễ sử dụng ngay cả khi không nhìn thấy, và tích hợp nhiều chức năng trong một ứng dụng.

Các ứng dụng hỗ trợ khả năng tiếp cận như vậy giúp người khiếm thị tham gia vào nhiều hoạt động hàng ngày, mang lại cơ hội tham gia xã hội mới nhờ sự tiện lợi của nó. Việc sử dụng công nghệ AI để hỗ trợ khả năng tiếp cận ngày càng trở nên quan trọng theo sự phát triển của thời đại, và nỗ lực của đóng góp một phần vào đó. Nhìn về tương lai hỗ trợ người khiếm thị, đang mở ra một kỷ nguyên mới về khả năng tiếp cận.