Модели o3 и o4-mini от OpenAI научились определять местоположение на фотографиях

21.04.2025

Новые модели искусственного интеллекта o3 и o4-mini, разработанные OpenAI, вызвали ажиотаж в сети благодаря своей способности анализировать изображения и определять их географическое местоположение. Эта функция стала популярной среди пользователей ChatGPT, которые теперь могут загружать фотографии для получения детальной информации о месте съемки.

Как это работает?

Модели используют продвинутые методы обработки изображений, включая анализ даже размытых или искаженных снимков. Они автоматически выполняют такие действия, как обрезка, поворот и увеличение фрагментов фото, чтобы повысить точность определения локации. В отличие от предыдущих версий, o3 и o4-mini интегрируют визуальные данные непосредственно в цепочку рассуждений, комбинируя их с текстовой информацией. Например, модель может распознать архитектурные особенности здания или природный ландшафт и сопоставить их с известными географическими точками.

Практическое применение

Пользователи уже активно экспериментируют с новыми возможностями. Одни загружают случайные снимки, чтобы узнать их координаты, другие решают математические задачи, используя фотографии учебников или рукописных схем. В соцсетях отмечают, что o4-mini часто выбирают для задач с расчетами, тогда как o3 справляется с более сложными визуальными анализами.

Проблемы приватности

Несмотря на восторженные отзывы, технология вызывает вопросы безопасности. Эксперты предупреждают, что возможность определять местоположение по фото может быть использована для слежки или сбора данных без согласия пользователей.

Заключение

Модели o3 и o4-mini демонстрируют значительный прогресс в области мультимодального ИИ, но их внедрение требует осторожности. Как отмечают разработчики, такие инструменты открывают новые горизонты для образования, туризма и исследований, однако баланс между инновациями и защитой приватности остается ключевым вызовом.