Сегодня прочитал мысль, приписываемую Лао Цзы:
Тот, чьи предсказания сбываются, мыслит правильно.
Мне очень понравилась эта мысль своей глубиной и краткостью.
Вообще-то, я уже не раз говорил здесь то же самое, что единственный значимый рычаг эффективности — это умение видеть наперед или предвидеть, если угодно.
Именно эту задачу решает предиктивный анализ и как его производная -- планирование.
Менеджер, которому собственники доверили управление своим бизнесом (или читайте капиталом), просто обязан обладать навыком достоверно прогнозировать, ну или иметь в своей команде предиктивного аналитика в качестве советника.
Без этого любой менеджмент -- не более чем блуждание в потемках и игра вслепую (за чужой счет). Ни одна другая экспертиза или навык не сравнится по своей значимости с этим.
Способность достоверно прогнозировать -- ключевой фактор эффективного управления.
Давайте подискутируем на эту тему.
Средняя заработная плата в компаниях — участниках рейтинга составила около 155 тыс. руб. в месяц.
Число вакансий для студентов и начинающих специалистов выросло за год на 15%.
Основные требования – широкий социальный пакет, а также все условия для комфортного пребывания в офисе.
При этом дефицит кадров наблюдается во всех отраслях.
Нет, виновны )) У меня была другая мысль. Посмотритте и почувствуйте разницу, пожалуйста )
Видела. А вы прочитали, что я написала? )
Это не полемика. Еще раз - я просто спросил. Первая книга в жанре учебника по когнитивной психологии вышла в 1967г.
Конечно. Авторство Вы не указали.
Кто-то пользовался продуктами SAS Inst. в целях этой дискуссии? Все шаги описаны достаточно подробно. Примеров из разных областей достаточно - для начала.
Так кто же Вас просил отвечать раз не интересно? Но я обойдусь и без Ваших советов, если позволите, с кем общаться. Надеюсь я ответил не более чем зеркально. Мне бы не хотелось переводить дискуссию в перепалку.
Думаю, что мои познания в этой области довольно скромны. Хотя я и занимаюсь системными решениями основанными на трудах Богданова, Анохина, Винера, если говорить за кибернетику.
Нет, делюсь соображениями. Даже на лекциях не позволяю себе вещать. Наоборот, стараюсь чтобы слушатели участвовали, сомневались, искали.
Нет, это подтверждает только мой тезис о том, что ИИ мощный инструмент работы с данными. А системы в которых он работает суть взаимодействие людей.
И Вам не хворать.
Ну, для Вас может быть ни о чëм. Но если дискуссия продолжается, значит интерес есть.
Цитируйте мысль до конца, пожалуйста, очень прошу
А это причем?
Вот авторство
А прогнозëры, они сами по себе или имеет всë же смысл встраивать их в систему принятия решений на предприятиях?
Тут стоит, Михаил, вспомнить и философию, религию, социологию. Всë, что раскрывает реальные интересы высших сословий или противоречит им, так или иначе блокировалось. Например, практически все уверены что кибернетика относится исключительно к искусственному интеллекту, к техническим системам, а социология заключается в социальной статистике.
Не вдаваясь глубоко в детали, арбитраж выглядит как: простое большинство при классификации исходов или (более продвинутый вариант) - взвешенное большинство, когда учитывается успешность каждой частной модели на предыдущих шагах, что и определяет вес ее результата при арбитраже..
В таких ситуациях есть все доступные исходные данные и, например, в дереве регрессий определяется семество регрессионных уравнений, а сам арбитраж вырождается для конкретного набора исходных данных в выбор конкретного уравнения регрессии - того, которое лучше всего показало себя именно на этих диапазонах данных. Т.е. вместо одного уравнения регрессии - семейство или иначе (для думерного случая) вместо регрессионной прямой - система отрезков, образующих ломаную.
Нет. SAS приостановила все операции в России.
Но это стандартные шаги в этом деле. Есть и открытые среды типа R, python с его не менее богатой экосистемой библиотек по работе с данными и моделям. По отдельным шагам процесса публикуются книжки. Чисто для справки - по практике, шаг 2 (To prepare the data for a predictive modeling...) может потребовать до 60-80% времени в общем цикле работ до включения моделей Predictive analytics в операционный цикл. Модели нуждаются в текущем сопровождении и обновлении.
То есть подбор уравнения регрессии для тех же данных, если я Вас правильно понял? А если близкие значения показывает, например, пара уравнений? Или для разных диапазонов исторических данных получаются разные ответы?
Возможно, у кого-то есть опыт использования инструментов SAS на эту тему в прошлом.
С R понятно. С последним утверждением полностью согласен.
Что я упустил?
Вот, что пишет на эту тему Бретт Ланц ("Машинное обучение на R", на мой взгляд очень простая практическая книга, доступная значительной части студентов МВА и просто менеджеров):
Дерево решений строит модель, очень похожую на потоковую диаграмму, где узлы решений, концевые узлы и ветви определяют последовательность решений, которые принимаются для классификации примеров. Такие деревья можно также использовать для числового прогнозирования, внеся лишь небольшие изменения в алгоритм построения деревьев.
Деревья для числового прогнозирования делятся на две категории. Первая — регрессионные деревья — была введена в 1980-х годах как часть фундаментального алгоритма построения дерева классификации и регрессии(Classification and Regression Tree, CART). Несмотря на название, в регрессионных деревьях, как уже говорилось ..., не используются методы линейной регрессии; вместо этого они делают прогнозы на основе среднего значения для имеющихся примеров, которые в итоге позволяют достичь концевого узла.
Вторая категория деревьев для числового прогнозирования — деревья моделей. Деревья моделей строятся примерно так же, как и регрессионные деревья, однако для каждого концевого узла строится модель множественной линейной регрессии на основе примеров, дошедших до этого узла. В зависимости от количества концевых узлов, дерево моделей может строить десятки или даже сотни таких моделей. Из-за этого деревья моделей труднее исследовать, чем аналогичные регрессионные деревья, но их преимущество заключается в том, что деревья моделей могут привести к построению более точной модели.
Т.е. в регрессионных деревьях и деревьях моделей все исходные данне делятся на две части - обучающую выборку и контрольную. В бутстрепе и кросс-валидации дело обстоит иным образом (источник тот же):
Если при кроссвалидации данные разделяются на блоки, в которых каждый пример может встречаться только один раз, то при методе начальной загрузки (он же - бутсреп) в процессе выборки с заменой примеры могут выбираться многократно. Это означает, что из исходного набора данных, состоящего из n примеров, при выполнении бутстрепа будет сформирован один или несколько новых тренировочных наборов данных, каждый из которых также содержит n примеров, некоторые из них повторяются. Затем для каждого из этих тренировочных наборов строится соответствующий тестовый набор данных, в который входят те примеры, которые не вошли в этот тренировочный набор данных.
Извините за дотошность, но короче и не скажешь. Однако,это только вершина айсберга! Бэггинг и бустинг - это уже про построение ансамблей моделей.
Обучающая выборка должна быть взята из динамично изменяющегося процесса. То есть должны быть переходы из одного состояния в другое с изменением тех параметров, по которым проводится апоксимация (регрессионный анализ).
Если процесс статичен, то взятая из него обучающая выборка не позволит построить адекватную модель. То есть при реальных изменениях обученная Система не сможет адекватно отработать этот переход.
Мы с этой проблемой сталкивались в нашей Системе улучшенного управления.