Невежество растёт быстрее учёности. Профанация на марше. Нас погубят дилетанты. Погоня за рейтингом заводит в тупик.
Вам не кажется так, коллеги?
Вот новость - в Англии женщина приняла помпон от шапочки за больного ёжика и привезла это в клинику.
"Concerned it “hadn’t moved or pooped all night” despite being given cat food, she anxiously waited for the vet to come back into the lobby to deliver some painful news: “It’s not a hedgehog - it is a hat bobble.”
Смешно? Смешно! Давайте посмеёмся над невеждами и псевдо-учёными.
Средняя заработная плата в компаниях — участниках рейтинга составила около 155 тыс. руб. в месяц.
Число вакансий для студентов и начинающих специалистов выросло за год на 15%.
Основные требования – широкий социальный пакет, а также все условия для комфортного пребывания в офисе.
При этом дефицит кадров наблюдается во всех отраслях.
Так технически - вообще проблем нет. Датасеты реальные не так велики во многих задачах, некоторые даже через почту "проходят". Остальное - хоть облако, хоть почта. Ну это детали. Основное - просто на досуге поразмыслить по теме. Вот пример - Kaggle, аналога коего у нас нет, к сожалению - там и данные и задачи и конкурсы и исследования и общение. Пока нет осознанности и хотя бы общей постановки задачи практические шаги пользы не принесут. Может быть что то такое появится позже.
Про персонал тема отдельная, есть технологический регламент установки, но в нем все параметры в диапазоне, а вот для оптимизации желательно правильно выбирать из диапазона, ну а тут опыт.
А нашу Систему нужно было перевести в режим обучения (настройки) на достаточно длительный период времени, чтобы он подстроился под новые условия. Точнее она сама переводилась в этот режим, она понимала, что ее настройки не соответствуют реалиям.
Это кстати одна из причин, почему продукт не пошел.
Ну а вообще есть технологический регламент установки, но в нем все параметры в диапазоне, а вот для оптимизации желательно выбирать из диапазона.
Задачка интересная. Надо бы хорошо обдумать её. Хотя, друзья, времени нет совершенно. Сижу на 3-х проектах, отпуска и летняя лень )))
Я так понял задачу:
Создать некую софтину, которая бы позволяла настраивать/обучать через возможности API чужого ИИ некие специфические данные?
Ну это - очень сильно! Может сначала песочницу типа - вот обезличенные стандартизованние данные и задача такая - своими сумбурными словами. Ну и предложения - модели, в т.ч. прогнозные, т.к. предполагается, что задачи практические. Польза и заказчикам и разработчикам. Из этого иногда что-то и получается. И мне кажется, что никому и ни на что в этом направлении не стоит "подписываться". Это - как пойдет. Не обязательно сразу решения обсуждать, можно и сами постановки "покачать", подходы. Это, иногда, даже более ценно. Может это вообще публике местной неинтересно. Бывает. Может тут больше про психологию - тоже неплохо. Но если про ИИ - то общие рассуждения и опасения давно уже известны, тонны научпопа.
Ну это - "воскресные мечтания". А завтра - уже понедельник?
Было бы неплохо нарисовать структурную схему, и уже по ней рассматривать, кто чем будет заниматься.
Вы как-то пользовались этой платформой - практически?
Да, немного. Иногда датасеты скачиваю, бывают интересные. Иногда читаю обзоры всякие. У нас датасетов интересных не очень много, раньше брал на HSE, но там по экономике и населению, в основном. Промышленных, отраслевых - совсем не встречал пока. Может они уже есть?
Согласен, было бы неплохо. Но схема проста. Как вариант: условный автор пишет (я не химик, пример условный): "Есть задача определения дозы катализатора в зависимости от характеристик сырья. Результат - например, доля выхода нужного продукта из тонны сырья. Вот файлик с фактическими измерениями - характеристики сырья, доза катализатора и рузультат, скажем 150-200 измерений. Хочется - подобрать модель (сеть, дерево, регрессию и т.д.) для прогноза." Те, кто хочет предложить что-то - могут предложить с оценкой точности. Можно и обсудить и уточнить. Но я все это совсем не навязываю. Это по желанию. Посмотрите на тот же - Kaggle.
Так если переменный состав сырья, то тут основная проблема давать информацию Системе о текущем составе сырья в режиме реального времени. Для этого нужен поточный газоанализатор (в нефтехимии и газохимии реакции идут в газообразном виде), а это очень дорогая игрушка.
Мы на том и остановились, что Заказчик не захотел ее покупать.
А лабораторный учет состава сырья - это уже не в режиме реального времени. Ну будут пару раз в сутки заводить данные лабораторного анализа.
Вполне возможно. Приводившийся пример был о составе из нескольких цистерн с нефтью. Там не было задачи непрерывного контроля - измерили показатели, определили дозировку. И процесс пошел. Через несколько часов приедет новый состав. Сейчас это определяет человек - по опыту. Это не значит плохо, но люди хотели лучше. Одно другого не отменяет.
Саое интересное - содержательная задача. Кстати на конференции как раз многие чиновники говорили о датасетах отраслевых по актуальным проблемам. Но когда это будет?
Давайте я дам свой комментарий по задаче о составах разной нефти, приходящей на нефтеперерабатывающий и нефтехимический завод, благо с аналогичными задачами сталкивался.
Допустим мы сделали систему ИИ или лучше назвать ее самобучающуюся систему.
Пришел состав из 20 цистерн нефти одинакового состава. Сырье запустили в производство, изначально Система работает в режиме самообучения, то есть опробования разных вариантов с выбором оптимальной схемы управления и регулирования.
Процесс обучение допустим занял одну цистерну (а может 10), причем процесс обучения неэкономичный, поскольку в его процессе опробуются разные варианты.
Процесс обучения завершился и следущие 19 цистерн Система работает в режиме оптимального управления и регулирования.
Пришел следующий состав нефти одинакового, но другого, состава, Система перешла в режим самообучения, которая опять же занял одну цистерну (а может 10), далее переход на режим оптимального управления и регулирования.
И так с каждым составом.
А теперь допустим у нас есть поточный газоанализатор и к нам пришел состав из 20 или 40 цистерн нефти разного состава, причем в этом составе представлен весь диапазон составов нефти, который может поступать на завод.
И мы запустили режим самообучения на весь состав с учетом влияния состава нефти, информацию о котором Система получает в режиме реального времени.
Допустим на этом составе Система прошла полный цикл самообучения, и после этого любой следующий состав нефти Система обслуживает в режиме оптимального управления и регулирования.
Все почти так. Однако же, систему дообучать стоит периодически, т.к. появляются новые данные о результатах. И еще - мы же не все факторы правильно учли, есть некоторая неполнота информации. Более того, иногда и состав предикторов (регрессоров) может меняться. Что происходит внутри нейросети - никому неизвестно. Это неплохой подход, но содержательной интерпретации не поддается. Более того - по новым данным и сам "движок" системы поддержки принятия решений может меняться - сеть, регрессия, деревья решений или опорные вектора , баейс и т.д.. Ну это мы уже слишком углубились. На прикладном уровне важна исходная тема. Иногда много бывает тумана и люди не знают как подступиться.
Для меня - это давнее занятие, когда-то изготавливались скоринговые системы и даже статьи писал по теме (ну не о психологии же или детских впечатлениях), уже хобби, спасающее от рутины и общей депрофессионализации с уклоном в психологию и психоаналитику. Но опять же - это просто обдумать на досуге. Реальная задача сама "постучится". Если ее нет - то и темы нет.
Опять же прокомментирую по нашей Системе.
Поскольку она являлась надстройкой на DSC (распределенная Система управления агрегатами и технологической установкой), то за предотвращением аварийных и иных нежелательных ситуаций отвечала DCS, она просто не дала бы установке уйти за границы дозволенного и просигнализировала бы персоналу о такой попытке, и в любой момент все это просто бы перешло на ручное управление под ответственность дежурной смены.
Более того, если бы Система поняла бы что идет не туда, она бы сама сняла с себя функции управления (перешла в режим созерцания), заморозив ситуациии и выдав соответствующую сигнализацию.
Поэтому, мы то готовы были поставить ее куда угодно, но Заказчик не был готов, посколько все это стоит денег, а эффект для него не очевиден.
Конечно, вопрос автоматического сведения вместе различного "опыта" мы не рассматривали, каждая работа шла по отдельному циклу, в самих настройках и конфигурации, конечно, мог учитываться предыдущий опыт.
Вельзевул (ивр. בעל זבוב, Вельзевул, Баальзвув, Баал-Зебуб) — имя одного из ханаанейских божеств, упоминающегося в Ветхом Завете. В период написания Нового Завета было одним из принятых имён Сатаны в иудаизме.
Переводится как «Повелитель мух».
Любопытный факт.
Комментариев много, поэтому пока прочитал только первый пост Анатолия Курочкина. Я с этим постом соглашусь. И проблема не такая простая. Она меня тоже волнует, т.к. повышение уровня невежества - это менее эффективная экономика и более низкий уровень жизни.
Наверняка многие участники дискуссии знают понятие "технология карго культа". Также предполагаю, что многие знают понятие "компетентностное образование" и цикл Ноэля Берча (авторство не гарантируется). И проблема в том, что современные технологии обучения нарушают требования этого цикла, что и приводит к появлению карго-культов.
Более того, по ряду понятных причин, само обучение превращается в карго-культ и создает не специалистов, а носителей новых карго-культов
У меня есть цикл семинаров на эту тему и обычно слушатели "под впечатлением".
Сейчас я работаю над созданием бизнес-школы, которая, по замыслу, должна решить эту проблему. Оказалось сложнее, чем я думал. Т.е. открыть школу не проблема. Проблема - сделать так, чтобы это было качественное обучение.
Надеюсь, что найду решение.