Гонка генеративных чат - ботов ИИ

С помощью SwiftKey компания Microsoft принесёт ИИ Bing на все смартфоны с Android​

Релизная версия будет развёртываться поэтапно​

Экранная клавиатура SwiftKey является одной из лучших клавиатур на Android. Её аналогами выступают Gboard, Samsung Keyboard или «Яндекс Клавиатура», однако у решения Microsoft есть свои особенности. Как сообщается, компания интегрирует свой чат-бот Bing в клавиатуру для Android.

С помощью SwiftKey компания Microsoft принесёт ИИ Bing на все смартфоны с Android

Развёртывание пойдёт поэтапно, так что в разных странах релиз может состояться в разные дни. Отмечается, что новая возможности встроена в версию SwiftKey 9.10.11.10.

Что касается возможностей ИИ Bing, что они типичны для чат-ботов. К примеру, можно искать данные в интернете, используя искусственный интеллект. Система также позволит создавать «выжимку» данных, а также предоставит помочь при решении тех или иных вопросов.

Отметим, что аналогичная возможность в клавиатуре SwiftKey для операционной системы iOS пока не заявлена, так что, возможно, это будет временный эксклюзив Android.

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
Нейросеть научилась читать мысли, причём неинвазивным способом
Импланты не нужны?

Специалисты из Техасского университета Остине, США, разработали систему для перевода мыслей человека в текст. В основе её лежит языковая модель GPT, причем самой первой версии. Сообщается, что декодер смог не только визуализировать, но также интерпретировать суть того, что люди слушали, смотрели или воображали. При этом метод оказался неинвазивным.

1682953506951-your-paragraph-text-99.jpg

Источник: vice.com

Для считывания данных использовалась технология функциональной магнитно-резонансной томографии (фМРТ), которая позволяла отслеживать активность мозга. В самом эксперименте приняли участие 3 человека, каждый из которых суммарно 16 часов слушал различные истории. После этого данные сканирования были переданы нейросети, которые успешно перевела их в текстовую форму. Отмечается, что система пока находится на ранней стадии, однако результаты уже впечатляют.

При этом авторы признают, что такие технологии можно применять и с преступными целями, а также для различного рода слежки. Предполагается, что государства или корпорации могли бы злоупотреблять такими технологиями.

В целом же авторы пока видят перспективу развития таких систем в медицинском направлении. Как ожидается, в будущем подобные решения помогут людям с неврологическими заболеваниями, которые оказывают влияние на речь, общаться с внешним миром.

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
США выдали патент на российский ИИ на принципах, «которых не хватает chatGPT»

Российская компания Smart Engines получила в США патент на свое решение по оптимизации работы нейросетевых архитектур, которые используются для распознавания изображений. В понимании разработчиков, им удалось использовать подход, который, в частности, в будущем сможет улучшить ChatGPT.

Патент на российский ИИ
Как стало известно CNews, российские разработчики из отечественной компании Smart Engines получили в США патент на свою фирменную ИТ-разработку. Изобретение призвано оптимизировать работу нейросетевых архитектур, которые используются для распознавания изображений. Об этом редакции рассказали представители компании.

Авторами изобретения являются программист Smart Engines Александр Шешкус, генеральный директор компании Владимир Викторович Арлазаров, ее технический директор Дмитрий Николаев, директор по науке Владимир Львович Арлазаров. Большинство из них имеет различные ученые степени, вплоть до доктора технических наук.

Патент № US 11636608 B2 датирован 25 апреля 2023 г. (копия документа имеется в распоряжении CNews). Запатентованное решение уже используется в программных продуктах Smart Engines для автономного распознавания паспортов, ID-карт и других документов.

pass700.jpg

США зарегистрировали патент на разработанный в Smart Engines ИИ-метод

Smart Engines позиционирует себя в качестве научно-исследовательской компании, специализирующаяся на разработке алгоритмов компьютерного зрения, машинного обучения, искусственного интеллекта (ИИ), распознавании образов и поставке комплексных программных решений для автоматизации распознавания и ввода данных из документов в видеопотоке, на фотографиях и сканах.

В начале февраля 2023 г. CNews писал о другом патенте компании, также получено ею в США. Тогда Smart Engines зафиксировала за океаном права на систему локализации и идентификации документов на изображениях. В общей сложности Smart Engines зарегистрировала три патента в США, восемь — в России, а также создала 26 так называемых полезных моделей.

Что именно разработали россияне
Авторы зарегистрированного на днях изобретения, по их заверению, предложили новую нейросетевую архитектуру, объединяющую блоки, используемые в современных нейросетях, с классическим инструментом анализа изображений реального мира — преобразованием Хафа.

smart_957.jpg


Изображение иллюстрирует, каким образом нейронная сеть обнаруживает точку схода с помощью преобразования Хафа, опираясь на прямые на исходном изображении. Решение этой задачи необходимо, например, при создании беспилотников
«Основой современных нейросетей, обрабатывающих изображения, являются сверточные нейронные слои. В них каждый нейрон обрабатывает маленький кусочек входного изображения. Такие нейросети воспринимают изображение как иерархию произвольных деталей, а геометрические построения для них неестественны. Мы же предложили слой, в котором каждый нейрон обрабатывает одну прямую, лежащую на изображении. Это и есть преобразование Хафа», — пояснил CNews Дмитрий Николаев.

По его словам, на нейронную сеть можно смотреть как на большую математическую формулу. Каждый ее слой — это следующая функция, примененная к предыдущей. Если вы вставляете в эту последовательность новое преобразование, «то в другой философской парадигме» вы вставляете в нейросеть слой нейронов, которые определенным образом связаны с предыдущими и что-то считают. «Мы добавили нейроны, которые получают сигнал от нейронов предыдущего слоя, лежащих вдоль прямой. А с точки зрения математики этот слой — преобразование Хафа».

smart_465.jpg


Первый столбец иллюстрирует, как нейросеть обнаруживает внутренние точки документа с использованием преобразования Хафа, второй — как без него. Сеть с Хафом имеет в сто раз меньше обучаемых параметров, а также меньше весит и быстрее работает
Разработчики рассчитывают, что предложенная ими архитектура сможет оказать влияние на общее развитие нейросетевых технологий в компьютерном зрении. «Первые исследования хафовских нейросетей, уже опубликованные в научной периодике, полностью подтверждают эту идею», — заверяют они.

В пику ChatGPT
Комментируя свое изобретение, сотрудники Smart Engines не избежали сравнения разработки с алгоритмами, используемыми в ИИ-продукте ChatGPT — чат-боте американской компании OpenAI, который способен вести диалог с человеком и генерировать тексты и изображения.

«Нейросети замечательно извлекают информацию из примеров, но их практически невозможно научить непреложным законам физики или математики, — рассуждает Владимир Львович Арлазаров. — Показательны недавние упражнения сети ChatGPT в арифметике. При умножении больших чисел сеть правильно указывает первые и последние цифры результата, и даже угадывает его длину, а вот центральные цифры ставит “от балды”. Довольно забавный результат, ведь для правильного решения требуется в миллиарды раз меньше ресурсов, чем те, что есть в распоряжении у нейросети. Встает вопрос: а можно ли вообще изучать математику на примерах?».

Некоторые подробности изобретения
Самое частое использование преобразования Хафа — это поиск и выделение прямых, возвращается к вышеупомянутой теме Александр Шешкус. — Они в области обработки и анализа изображений играют важнейшую роль: это и дороги, и дома, и границы документа, и строки, и рентгеновские лучи, формирующие томограмму, и многое другое».

Однако, как отмечает эксперт, эти отрезки почти всегда не совсем прямые, часто зашумлены или видны только частично, имеют разную длину. Поэтому проведение классического Хаф-анализа изображения представляет собой довольно сложную задачу. «Между тем, как раз с теми проблемами, которые затрудняют Хаф-анализ изображения, прекрасно справляются нейросети и, более того, существуют систематические методы решения подобных проблем», — говорит он.

По словам Дмитрия Николаева, сейчас большая часть задач технического зрения решается с использованием нейросетей, в развитии которых много лет не ставился вопрос экономии. При этом именно для задач зрения характерны большие объемы входных данных даже в тривиальных приложениях. В результате проблема сокращения вычислительных затрат стоит крайне остро.

«Предложенная нами архитектура с использованием преобразования Хафа обеспечивает конкурентное качество при значительно меньшем количестве обучаемых параметров и при требовании меньшего количества вычислительных мощностей», — подчеркивает он.

Зачем российской компании патенты в США
Как рассказал CNews Владимир Викторович Арлазаров, у Smart Engines на сегодняшний день уже есть клиенты на рынке США, использующие ее систему распознавания документов.

«Это очень важно для любой научно-исследовательской компании — защищать свое ноу-хау патентами, в том числе патентами США», — уверен он. При этом, как можно было заключить с его слов, занимаясь патентованием за рубежом, компания тем самым повышает собственную стоимость.

Несколько фактов о Smart Engines
По данным компании, она была основана в 2016 г. учеными ряда институтов Российской академии наук (РАН) в области распознавания и обработки изображений. Сегодня в Smart Engines работают более 70 сотрудников.

По сведениям ЕГРЮЛ, учредителями зарегистрированного в Москве ООО «Смарт энджинс сервис» выступают Владимир Викторович Арлазаров с долей в 25,39%, Владимир Львович Арлазаров — 17,05%, Дмитрий Николаев — 17,05%, Сергей Усилин — 17,05%, Константин Булатов — 10,23%, Александр Шешкус — 10,23%, Никита Арлазаров — 3%.

По данным «Контур.фокуса», по итогам 2022 г. выручка организации составила 382,9 млн руб. с приростом этого показателя на 36% по сравнению с предыдущим годом.Чистая прибыль оказалась на уровне 171,6 млн руб.

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
ChatGPT научился понимать голосовые команды и работать с изображениями

OpenAI расширила варианты взаимодействия с ChatGPT. Новая версия чат-бота теперь принимает в качестве промтов (подсказок) не только текст, но также изображения и голосовые команды. Для коммерческих пользователей новые возможности станут доступны в ближайшие две недели, а остальным придётся какое-то время подождать.

chatgpt-notebook-the-verge-com.jpg

Источник изображения: The Verge

Общение голосом с ChatGPT в чём-то похоже на разговор с любым голосовым помощником, но, по утверждению OpenAI, качество ответов значительно выше благодаря улучшенной базовой технологии. Пользователь нажимает кнопку и произносит вопрос, ChatGPT преобразует его в текст и передаёт в большую языковую модель, получает ответ, преобразует его обратно в речь и произносит ответ вслух.

Новые возможности ChatGPT опираются на большую языковую модель Whisper, которая выполняет значительную часть работы по преобразованию речи в текст и обратно. По утверждению OpenAI, новая модель может генерировать «человеческий голос из текста и образца речи длиной в несколько секунд». Пока доступно пять вариантов голоса ChatGPT, но OpenAI видит в этой модели гораздо больший потенциал.

Возможность создать синтезированный голос любого человека, опираясь всего на несколько секунд его речи, даёт широкое поле деятельности для киберпреступников, признаёт OpenAI в анонсе новых функций: «Это новые риски, такие как возможность злоумышленников выдать себя за общественных деятелей или совершить мошенничество». По утверждению компании, модель недоступна для широкого использования именно по этой причине: OpenAI планирует ограничить модель конкретными вариантами использования и партнёрскими соглашениями.

Что касается запроса в ChatGPT при помощи изображения, пользователю достаточно сфотографировать или нарисовать предмет своего интереса и отправить боту. В процессе общения можно применять текстовые или голосовые подсказки, чтобы уточнить запрос или ограничить область поиска.

Очевидно, что использование изображений в качестве подсказки для чат-бота также имеет свои потенциальные проблемы. В первую очередь это касается запроса о личности человека на фотографии, хотя OpenAI заявляет, что ограничила «способность ChatGPT анализировать и делать прямые заявления о людях» как по соображениям точности, так и по соображениям конфиденциальности.

Спустя почти год после первого запуска ChatGPT OpenAI продолжает расширять границы применения и использования своего чат-бота, пытаясь избежать связанных с ним проблем и недоработок. В частности, компания намеренно ограничивает возможности своих новых ИИ-моделей. Но такой подход не будет работать вечно. По мере того, как все больше людей используют голосовое управление и поиск изображений, а ChatGPT становится мультимодальным и полезным виртуальным помощником, удерживать ИИ в рамках будет все труднее и труднее.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
В WhatsApp запускают аналог ChatGPT и Midjourney – можно задавать вопросы и спорить с ботами, генерировать стикеры и фотореалистичные изображения
Тестирование началось среди ограниченного круга пользователей

На мероприятии Meta Connect команда WhatsApp рассказала о грядущих изменениях в популярном мессенджере. В WhatsApp планируется добавить несколько новых функций на основе системы искусственного интеллекта.

1.png


Сразу после конференции некоторым пользователям станут доступны для тестирования в чатах три новых сервиса. Первый - AI stickers (Стикеры ИИ), позволяет генерировать индивидуальные стикеры.

AI chats (Чаты ИИ) – аналог чат-бота ChatGPT, позволит задавать боту вопросы на «любые темы», а также устраивать дебаты с групповых чатах с «десятками уникальных персонажей», созданными ИИ.

И, наконец, третье нововведение – генерация фотореалистичных изображений по текстовым описаниям. Пользователю достаточно набрать команду /imagine и добавить краткое описание.

В документе поддержки WhatsApp поясняют:

Визуально чаты с ИИ будут отличаться от личных сообщений и чатов. Чтобы начать общение с ИИ-ботом, вам потребуется сначала открыть чат с ИИ или отправить боту сообщение.


Источник Для просмотра ссылки Войди или Зарегистрируйся
 
Переписки пользователей с ИИ-ботом Bard всплыли в поиске Google

Несмотря на стремительный рост популярности чат-ботов на основе нейросетей, таких как ChatGPT от OpenAI или Bard от Google, на данном этапе такие алгоритмы имеют немало недостатков, в том числе связанных с конфиденциальностью. Это утверждение доказывает появление в поисковой выдаче Google ссылок на чаты пользователей с ИИ-ботом компании.

google_bard_extensions.jpg

Источник изображения: blog.google

Исследователь Гаган Готра (Gagan Ghotra) одним из первых обратил внимание на то, что в поисковике Google появились ссылки на чаты пользователей с ботом Bard. Перейдя по одной из таких ссылок, можно просмотреть историю общения того или иного пользователя с ИИ-алгоритмом. Хотя данные самих пользователей в беседах не указываются, в сообщениях вполне может содержаться какая-либо конфиденциальная информация, о чём исследователь и поспешил предупредить пользователей, опубликовав соответствующее сообщение в соцсети X.

Питер Лю (Peter Liu), научный сотрудник принадлежащей Google компании DeepMind AI, попытался смягчить ситуацию, заявив, что в поисковой выдаче появились ссылки на чаты пользователей, которые задействовали функцию «Поделиться», с помощью которой можно показать результаты общения с ботом кому-то другому. Однако такое объяснение не удовлетворило пользователей и было раскритиковано. Многие посчитали, что даже в случае использования функции «Поделиться» люди хотят передать результаты своего общения с Bard кому-то конкретному, а не делать их общедоступными в интернете.

Проблема усугубляется тем, что индексация чатов с ИИ-ботом, отличается от того, как функция «Поделиться» работает в других продуктах компании, таких как Google Документы или Google Диск. Кроме того, при использовании корпоративных продуктов Google появляется предупреждение о том, что делиться контентом с людьми за пределами домена организации пользователя может быть опасно. Однако в случае с Bard никаких уведомлений о том, что результаты общения с ботом будут проиндексированы и станут общедоступными, не появляется.

В конечном итоге Google, по всей видимости, признала наличие проблемы и в настоящее время работает над её решением. «Bard позволяет людям делиться чатами, если они того пожелают. Мы также не планируем, чтобы эти чаты индексировались поисковиком Google. Сейчас мы работаем над тем, чтобы заблокировать их индексацию», — заявил Дэнни Салливан (Danny Sullivan), представитель Google по связям с общественностью.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Мобильное приложение ChatGPT обновило рекорд по загрузкам и выручке, но темпы роста начали падать

На фоне бума на рынке генеративного ИИ число установок чат-бота ChatGPT на базе ИИ продолжает расти вместе с выручкой от его использования, достигшей в сентябре рекордной величины в $4,58 млн. Также было зафиксировано рекордное число загрузок приложения для iOS и Android по всему миру за месяц — 15,6 млн. Вместе с тем аналитическая компания Appfigures предупредила о снижении темпов роста выручки.

ai-generated-8177860_1280.jpg

Источник изображения: Pixabay

По оценкам аналитиков Appfigures, последние пару месяцев рост выручки превышал отметку в 30 %, составив 31% в июле и 39 % — в августе, в то время как в сентябре он снизился до 20 %.

Как отметил ресурс TechCrunch, замедление роста выручки может быть первым признаком приближения числа пользователей ChatGPT к максимальному с точки зрения готовности платить за обновлённую службу подписки ChatGPT+ в размере $19,99 в месяц, которая обеспечивает более быстрое время отклика, приоритетный доступ в часы пик и ранний доступ к новым функциям и усовершенствованиям. И всё же пока подписка ChatGPT+ пользуется спросом: выручка от использования ChatGPT на мобильных устройствах в июне составила $2,1 млн, в июле — $2,74 млн, в августе — $3,81 млн, и в сентябре установила новый рекорд — $4,58 млн.

Следует отметить, что ChatGPT вовсе не лидирует по доходности среди приложений ИИ. Его конкурент Ask AI «зарабатывает» гораздо больше благодаря большим расходам на рекламу: с $6,48 млн в мае, когда было запущено мобильное приложение ChatGPT, до пика в $6,55 млн в августе (согласно данным Appfigures). В сентябре выручка от использования приложения Ask AI упала до $5,51 млн, что всё равно больше, чем у ChatGPT. Сообщается, что другие ИИ-приложения, такие, как Genie и AI Chat Smith, заметно отстают по доходам от Ask AI. Впрочем, с учётом расходов на рекламу Ask AI может уступать ChatGPT по прибыльности даже при большей выручке.

По оценкам Appfigures, общее количество установок мобильного приложения ChatGPT с момента его выхода достигло 52,2 млн. Лидирует по количеству загрузок Google Play: в сентябре из 15,6 млн загрузок на его долю пришлось 9 млн, а на App Store — остальные 6,6 млн. Впрочем, это не мешает App Store лидировать по полученной выручке от покупок в приложении, составившей в сентябре $3 млн.

Крупнейшим рынком для приложений чат-ботов на базе ИИ являются США, на которые приходится 60 % доходов ChatGPT.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Нейросеть YandexGPT 2 успешно сдала ЕГЭ по литературе

Разработанная «Яндексом» большая языковая модель YandexGPT 2 справилась с несколькими вариантами ЕГЭ по литературе, получив усреднённую оценку 55 баллов. Это выше минимального порога, необходимого для поступления в вуз (40 баллов) и близко к средней оценке (64 балла), которую получают российские школьники, когда выбирают данный предмет и специально готовятся к экзамену.

yandex1.png

Источник изображений: «Яндекс»

ЕГЭ по литературе содержит несколько испытаний разного рода: вопросы на эрудицию, а также задания для оценки стиля письма и творческих способностей. Для нейросети это непростая задача, но YandexGPT 2 выдержала все испытания: в первой части экзамена она проанализировала произведение и ответила на вопросы о нём, а во второй — написала сочинение на предложенную тему.

yandex2.png


В рамках испытания специалисты «Яндекса» получили в Московском центре непрерывного математического образования варианты настоящего ЕГЭ по литературе, которые использовались на тренировочных экзаменах с 2021 по 2023 гг., и удостоверились, что в массиве использованных при обучении YandexGPT 2 данных ответов на эти вопросы нет. Таким образом, нейросеть работала с заданиями наравне с любым школьником, выбирая предложенные варианты и генерируя ответы на открытые вопросы. Проверку проводили официальные эксперты ЕГЭ по литературе.

Разница между сдающими ЕГЭ школьниками и YandexGPT 2 в том, что первые специально готовятся к сдаче, то есть погружаются в специфику предмета, тогда как нейросеть работала скорее экспромтом — схожим образом сдаёт школьные экзамены взрослый человек, опираясь только на накопленные знания. Стандартным способом проверки нейросетей является тест MMLU (Massive Multitask Language Understanding) — он включает вопросы из 57 областей, но не предусматривает оценки ответов на открытые вопросы или написания творческих заданий. Поэтому в «Яндексе» остановились на ЕГЭ по литературе.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
Baidu представила китайскую нейросеть Ernie 4.0 и утверждает, что она лучше GPT-4

Основатель Baidu Робин Ли (Robin Li) заявил, что разработанная компанией большая языковая модель в полной мере догнала созданную OpenAI GPT-4, а сам китайский интернет-гигант стал лидером в гонке с США.

baidu.jpg

Источник изображения: baidu.com

Накануне господин Ли провёл в Пекине презентацию Ernie 4.0, продемонстрировав способность искусственного интеллекта давать адекватные ответы и на лету решать сложные задачи. Ernie, по версии главы Baidu, не уступает чат-боту от OpenAI по сложности и общим возможностям. Сейчас аудитория китайской ИИ-системы составляет 45 млн пользователей — для сравнения, у ChatGPT их уже 180 млн. Baidu рассчитывает, что ИИ поможет ей превзойти крупнейших местных игроков, включая Alibaba и Tencent.

Объективно оценивать возможности моделей ИИ на так просто. В ходе презентации чат-бот Ernie Bot в реальном времени ответил на вопросы, связанные с рынком недвижимости, решил задачи по математике и по команде написал рассказ, действие которого происходит в мире древних боевых искусств. В марте платформа была значительно слабее, и на первой презентации Baidu ограничилась лишь видеозаписью. В июне компания заявила, что её нейросеть сравнилась в общих возможностях с моделью GPT-3.5, а в отдельных задачах, связанных с китайским языком, превзошла и более продвинутую GPT-4.0.

Baidu надеется, что мощная платформа ИИ поможет ей отвоевать долю китайского рынка, которую она потеряла с приходом суперприложений от ByteDance и Tencent. Ernie интегрирован в такие флагманские продукты как веб-поиск, карты, обмен файлами, совместная работа и анализ данных. Недавно приложению чат-бота удалось возглавить список самых популярных в Китае приложений для iPhone, продемонстрировав более 1 млн загрузок в день запуска, но вскоре его сместил настоящий лидер местного рынка — мессенджер WeChat от Tencent.

Источник: Для просмотра ссылки Войди или Зарегистрируйся
 
СберБанк представил следующее поколение чат-бота GigaChat
Новая модель доступна всем пользователям GigaChat


Команда СберБанка представила первую модель следующего поколения фирменной генеративной нейросети GigaChat. Как отмечает пресс-служба, за счет изменения подхода к обучению в ней значительно улучшились практически все умения модели, от сокращения текстов и ответов на вопросы до генерации идей.

IMG_0173_large.JPG

Размер текста, с которым теперь можно работать, увеличен в 2 раза. Новая модель доступна всем пользователям GigaChat.

Также теперь общаться с GigaChat можно в социальной сети «ВКонтакте» — достаточно активировать бот. Сервис генерирует тексты, рисует по текстовому запросу с помощью модели Kandinsky и придумывает идеи «на все случаи жизни».

Вице-президент по цифровым решениям «Салют» Сбербанка Денис Филиппов рассказал:

На сегодняшний день количество уникальных пользователей GigaChat достигло 1 млн. А сегодня мы выпустили первую модель нового поколения GigaChat. Сервис не просто умеет общаться как человек, но и в процессе дообучения совершил рывок во всех генеративных задачах. По последним результатам сдачи экзамена для нейросетевых моделей MMLU (Massive Multitask Language Understanding) GigaChat улучшил свои показатели в два раза. Наиболее впечатляющий прогресс достигнут в суммаризации, когда вам нужна выжимка из большого текста, чтобы не читать его целиком. По суммаризированному тексту можно получить ответы на любые вопросы или попросить сформулировать ключевые мысли.

Источник Для просмотра ссылки Войди или Зарегистрируйся
 
Назад
Сверху