Мы в targetai специализируемся на создании ИИ-ассистентов для клиентского сервиса. И голосовые агенты для нас — один из ключевых сценариев. В какой-то момент мы с командой пришли к пониманию, что зависимость от вендорских TTS-сервисов — это риск. Пришлось договариваться, что вообще можно считать «хорошим голосом» для ИИ-агента. Эта статься посвящена формированию критериев отбора TTS-движка. Сравнение моделей я тут затрону вскользь, пока можно ориентироваться на данные, которые наш маркетинг опубличил во время релиза нашего движка targetspeak. И, кстати, есть хороший обзор open source TTS-решений с точки зрения метрик у коллег из Raft.
Читать далееПовод для написания этого материала подсказали организаторы конференции Startup Village 2026, прошедшей в конце мая в Инновационном центре «Сколково». Они отказались от привычной модели обсуждения технологий будущего, сделав ставку на практику и спрос больших компаний. Представители крупных компаний в этот раз приехали в «стартап-деревню» не слушать молодежь, а формулировать им свои запросы на технологии. В центре внимания оказалась экономика технологического спроса — подход, при котором конкретные потребности бизнеса становятся отправной точкой для создания и внедрения новых технологий.
Читать далееКогда Kubernetes-кластеров становится несколько, сложность быстро перестаёт ограничиваться самим развёртыванием. Приходится удерживать контекст сразу между инфраструктурой, инструментами и командами.
В Nova Container Platform для таких задач развивается Cluster Manager: он показывает список кластеров, хранит часть параметров и позволяет запускать операции через интерфейс и API.
Меня зовут Семен Месилов, я технический лидер Nova Container Platform. В статье расскажу, как мы подошли к этой задаче, и что уже получилось сделать в Cluster Manager.
Читать далееРаспознать "здравствуйте" в записи — задача, которая уже решена. Труднее понять, кому это "здравствуйте" сказано, кто стоит у кассы в этот момент, и было ли приветствие вообще, если клиент коротко ответил "ага" на фоне работающего холодильника.
Дано: сеть АЗС, ручной аудит покрывает несколько процентов смен. Всё остальное — "слепая зона". Заказчик хотел её закрыть с помощью существующих камер и микрофонов: взять архивные записи, автоматически выделить сессии обслуживания, проверить по чек-листу. Никакого нового оборудования, только то, что уже есть на точках.
Ограничение, которое определило всю архитектуру: кассир у микрофона говорит громко и развёрнутыми фразами. Клиент отвечает коротко, тихо и иногда вообще кивает. Стандартный ASR-пайплайн из этой пары слышит только одну сторону.
Видео первично: без стабильного ID клиента и временных границ сессии аудиоаналитика работает вхолостую. Начали с трекинга.
Читать далееПривет, Хабр! Меня зовут Андрей и я развиваю портал для разработчиков в корпоративном мессенджере Пачка. Эта статья про то, как мы превратили рукописную ноду для n8n в артефакт, который генерируется из одного файла спецификации, и как она прошла официальную верификацию и встала в каталог n8n со статусом verified by n8n.
По дороге мы выбросили целиком первую версию ноды и перевели всю документацию API на новый процесс генерации. Ниже — как это устроено внутри, с кодом и граблями.
Если коротко, что получилось: правка в одном .tsp-файле автоматически расходится в документацию, CLI, SDK и n8n-ноду, а CI публикует всё по реестрам. Нода больше не может отстать от API, потому что собирается из того же источника.
Читать далееВ первой части я разобрал глобальную картину: 824 000 увольнений, три краха за 26 лет и главную причину - дешёвые деньги, которые кончились. Вывод был такой: виноваты не технологии, а ставки. В этой части решил посмотреть, как это выглядит у нас.
Читать далееВы когда-нибудь задумывались, с чего это физики так уверены, что частицы летят строго по прямой? Ну, электрон там, фотон… Откуда взялась эта уверенность?
Я прочитал популярную статью про двухщелевой эксперимент. Автор писал: «Если свет — частицы, они должны лететь прямо и дать две полоски. А получился интерференционный узор — значит, свет — волна».
И меня зацепило не само противоречие (корпускулярно-волновой дуализм — это я уже слышал), а исходная посылка: «частицы летят прямо». Почему мы вообще так решили? Потому что так летят пули и бильярдные шары? Но зачем экстраполировать макромир на микромир?
Короче, я начал думать. И пришёл к альтернативной картине реальности. Она, конечно, спекулятивна, но довольно самосогласованна. И главное — в ней квантовая механика становится следствием геометрии, а не набором магических постулатов.
Если вам интересно, как из «частицы не летят прямо» родилась модель с чёрными дырами, слоёным пространством-временем и единым объяснением всех четырёх взаимодействий — добро пожаловать под кат.
Читать далееВ декабре 2024 я запустил антиспам-бот для Макс — по той же схеме, что уже годами работает в Telegram. Через месяц платформа удалила бота без объяснений. Поддержка отвечала: «работаем над вашим вопросом, ждите». Досудебная претензия заказным письмом — разблокировка и ответ в духе «вы согласились с правилами при регистрации».
Если вы разработчик ботов и думаете зайти в Макс — ниже не обзор «какие у меня продукты», а разбор того, что реально ломается на платформе и какие архитектурные решения пришлось собрать на ходу. Два кейса: антиспам (перенос TG-логики) и «Почтальон» (мост Макс ↔ Telegram), который родился уже после блокировки.
Читать далееЕсть много причин, по которым вам может понадобиться установить нейросеть локально на компьютер. Например, вы не хотите зависеть от отключений интернета или вам нужно пользоваться ИИ на ноутбуке без сети.
Так или иначе, такая опция предусмотрена и абсолютно легальна: DeepSeek распространяется бесплатно и у него открытый исходный код.
Ниже я расскажу, как установить DeepSeek на компьютер при помощи приложения LM Studio.
Читать далееКак на собеседовании отличить системного аналитика, который учил REST по учебнику, от того, кто реально проектировал API?
В статье — три живых кейса из практики в FinTech и e‑commerce. Вы сможете проверить себя, увидите разбор популярных ошибок и узнаете, почему даже опытные инженеры спорят про PATCH и 409.
Проверить себяНесмотря на то что эпоха кассет давно закончилась, интерес к аналоговому звуку продолжает расти. В 2026 году кассетный ренессанс перешел из фазы ностальгического увлечения хипстеров в стадию серьезного аудиофильского дискурса. Индустрия видит рост продаж физических носителей, а вместе с этим регулярно возникают и обостряются технические споры: действительно ли разные типы магнитных лент звучат по-разному, или же большинство заявленных в спецификациях различий существует только на бумаге и в маркетинговых брошюрах ушедшей эпохи?
Читать далееНанять родственника — решение, которое кажется очевидным. Свой человек, доверяешь, не убежит к конкурентам. Но именно это решение чаще других приводит к двум потерям одновременно: теряешь и результат, и отношения.
Я разобрал эту тему честно: 2 плюса и 4 системных минуса — на основе реальных кейсов из практики. И главное — два конкретных сценария, что делать, если родственник уже работает, но не справляется.
Читать далееПривет, меня зовут Николай Разумовский, я дизайнер в команде цифровой трансформации Ареал. Как дизайнер я регулярно сталкиваюсь с задачей: нужно быстро получить уникальные изображения для интернет-магазинов, корпоративных сайтов, лендингов и презентаций. Если опираться только на стоки, процесс затягивается, а визуально проекты становятся похожими друг на друга.
Генерация через нейросети решает сразу несколько задач:
Читать далееПривет! Меня зовут Андрей, я инженер в Циане. Примерно год назад мы начали внедрять в работу AI-помощников для разработки, а несколько месяцев назад сфокусировались на Claude Code как самом продвинутом из доступных. Сейчас пилотно используем его в командах инфраструктуры, платформы, продуктовой разработки. Масштаб здесь велик, риски интеграции AI тоже. В статье я расскажу, какие проблемы мы решали в процессе внедрения. И призываю вас поделиться своим опытом в комментариях.
Читать далееРазбираем возможности ИИ-генератора видео Seedance 2.0 и версии Pro. Сравнение с Kling и Veo 3, лучшие промпты, лимиты, советы по созданию роликов и как пользоваться нейросетью из России без VPN. Полный обзор с примерами генерации видео.
Читать далееКороче, такая история. В моей практике бывало такое, что приходит команда и говорит: «хотим внедрить ИИ». А под этим она понимает что-то среднее между волшебной кнопкой и наймом робота на ставку аналитика. Через пару часов разговора выясняется, что ожидания и механика расходятся примерно на световой год. Происходит это часто — и именно поэтому стоит один раз разобраться, что там внутри и откуда берётся настоящий эффект.
Читать далееТестирование функциональности Direct I/O — задача сама по себе нетривиальная. Сложность возрастает, если проверить работу функциональности можно только на ненагруженной базе данных, а тестируемое приложение предназначено для работы с высоконагруженными системами.
Можно, конечно, ограничиться проверкой того, что на неактивной базе приложение не использует кеш. Но это не даёт ответа на главные вопросы клиента: «Будет ли реальная выгода в промышленной эксплуатации и не случится ли так, что активное резервное копирование снизит производительность базы данных?»
Меня зовут Наталья Лабчук, я занимаюсь тестированием Platform V CopyWala — системы резервного копирования и восстановления данных от СберТеха. Расскажу, как мы убедились в том, что функциональность Direct I/O в CopyWala при снятии резервной копии с высоконагруженной базы не ухудшает производительность кластера. Надеюсь, что почитать об этой задаче будет полезно тем, кто работает в разработке и тестировании Postgres-подобных баз данных, а также инженерам, которые отслеживают производительность и администрируют PostgreSQL.
Читать далееПеред вами тарелка рамена, бутерброды, десерт и ароматный обед. Половину из них кто-то готовил, фотографировал и, возможно, уже съел. Вторую половину придумала нейросеть. Ваша задача — угадать, где еда настоящая, а где очень убедительный обман.
Читать далееДобро пожаловать на мой маленький тестовый полигон.
В этой статье я расскажу, как столкнул лбами двадцать один алгоритм машинного обучения - от старой доброй линейной регрессии, KNN, случайного леса до троицы табличных королей (XGBoost, LightGBM, CatBoost), нескольких многослойных нейросетей и нейросетей с механизмом внимания. И я заставил их всех решать задачу, которая на первый взгляд кажется абсурдной (только на первый взгляд?).
Большинство бенчмарков в машинном обучении вроде MNIST или Titanic давно натренированы до дыр. На картинках побеждают свертки, а на табличных данных – градиентный бустинг. Предсказуемо. Скучно.
Поэтому я решил устроить особый стресс-тест, соревнование немного иного формата, проверка на предельную прочность на табличных данных.
Да... еще среди участников забега будет один новичок, о котором большинство читателей, вероятно, слышит впервые. Он не раскручен и не имеет армии поклонников на Kaggle. Но уже имеет красивое название – Полигармонический каскад. Это глубокая архитектура, выведенная из принципов теории случайных функций и индифферентности. В этом тестировании он выступал в роли новичка-аутсайдера. Но то, что он сделал с фаворитами, выглядит как читерство. Но об этом позже.
Итак, что же это за задача?
Читать далееНаткнулся на старую веб-камеру, которая валялась без дела. Дешевый вариант с посредственным качеством. С такой камерой не стать звездой онлифанс. Но выкидывать жалко. Пришла в голову мысль — почему не соорудить управление жестами для компьютера?
Полноценное управление компьютером, как в фильмах с Томом Крузом, пока остаётся фантастикой: руки затекают, случайные движения превращаются в случайные команды. А вот привязать к жестам пару действий — выключить звук, свернуть окна, прокрутить ленту — реально и за один вечер. Понадобится старая веб-камера, Python и готовые модели Google. В статье — пошаговая сборка, разбор кода и инструкция, как обучить модель реагировать на жесты.
Читать далее