science of learning что это

Science of learning что это

As an emerging discipline, the learning sciences are still in the process of defining itself. Accordingly, the identity of the field is multifaceted, and varies from institution to institution. However, the International Society of Learning Sciences (ISLS, [1]) summarizes the field as follows: “Researchers in the interdisciplinary field of learning sciences, born during the 1990s, study learning as it happens in real-world situations and how to better facilitate learning in designed environments – in school, online, in the workplace, at home, and in informal environments.

Our Talent Management division is currently focusing on the “science of learning” topic and several experts have given presentations about what that looks like for both the learner and the developers. By definition: Learning sciences (LS) is an interdisciplinary field that works to further scientific understanding of learning as well as to engage in the design and implementation of learning innovations, and the improvement of instructional methodologies. (wikipedia) Some of you may recall Multimedia Learning during your graduate work if not it is the study of learning to design for online learning.

What does all of this have to do with Captivate? Well, as I get more immersed in using web authoring tools like Captivate we have to keep in mind that although the learner may not know that why we design courses the way we do we are well aware of what we are trying to accomplish. Anymore, packaging the development tool with the respective LMS will give us the complete picture if the products we are developing are measuring the learners true learning capabilities. Because of the nature of my customers environment the science of learning is becoming very important for some of our topical areas.

Источник

Дорога в Data Science глазами новичка

Что такое Data Science?

В 21 веке информация повсюду. Вы буквально не можете жить, не оставляя вокруг себя информационный след. Зашли вы утром в ВК поставить пару лаек или купили в магазине пармезан, информация об этом сохранилась в огромных базах данных. А вдруг эта информация может быть полезна? Может быть, покупая один продукт, люди часто покупают и другой — тогда имеет смысл поставить эти полки рядом (или наоборот — в разных концах магазина). А может быть, скрытые закономерности есть в научных данных? Какие существуют наиболее эффективные алгоритмы их обработки? Можно ли, анализируя данные с фотографий или видео, научить компьютер узнавать на них объекты? Этим и многим другим может заниматься data scientist

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Почему появился этот пост

Мне довелось пройти Летнюю школу по анализу данных от ТГУ (Томск). На ней я надеялся получить структурированные знания с нуля о том, что такое анализ данных и машинное обучение, базовые знания для них. Коротко говоря, оказалось, что эта школа не совсем для новичков (как бы это ни позиционировалось в рекламе). Вот, что записано в моём блокноте на самой первой лекции:

Для первого дня сложно
Плюх в океан знаний
Я утонул

К концу школы структурированных знаний я так и не получил. Спикеры были очень разные и говорили на совсем разные темы. Зато какие были спикеры! Лекции нам читали (а некоторые и вели практику) люди из Яндекс, Сколтеха, IBM и томской IT-компании Rubius. Пусть я так и не узнал базовых вещей, а блокнот исписан терминами на погуглить. Зато, я увидел отличные примеры того, как можно применять анализ данных в самых разных областях: науке, индустрии и бизнесе. Базовые знания можно получить и самостоятельно, но понять, как можно их применять получается не всегда (отсюда работники Макдоналдс с красным дипломом). Школа явно показала пробелы в знаниях, которые необходимо заполнить

Об этом и данный пост. Здесь вы найдёте пошаговый план, как его видит человек, стоящий в начале этого пути. К каждой теме, которую следует изучить, будет прилагаться ссылка на курс. План рассчитан на людей без базы. Под базой я понимаю знание высшей математики и наличие навыков программирования. Для людей, обладающих этим, могу порекомендовать эту статью и специализацию по машинному обучению на Coursera. А также, буду благодарен за совет новичку. Итак, начнём!

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

0. Математический анализ

Если у вас нет высшего образования, пройти этот курс нужно обязательно. За алгоритмами машинного обучения и нейронных сетей скрывается в первую очередь математика. Если вам непонятны такие слова, как определитель матрицы или частная производная, начать следует именно отсюда. Если вы понимаете эти термины (или хотя бы знаете, где про них прочитать, чтобы вспомнить), этот пункт можно пропустить

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

1. Математическая статистика

В анализе данных без этой дисциплины никуда. Вот список курсов, которые обеспечат вам уверенное знание предмета:

•Курс «Основы статистики» на Stepik — отлично подойдёт для начала. Есть также продолжения курса, будет полезно пройти и их

•Курс «Математическая статистика» на Stepik — поможет закрепить полученные знания с помощью достаточного количества практики

•Курс «Статистические методы в гуманитарных исследованиях» на Coursera — пусть вас не отталкивает название, курс подойдёт для всех. Преподаватель потрясающий, так что будет понятно даже гуманитариям. Главное преимущество этого курса — параллельно идёт обучение работе в программах STATISTICA и R

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

2. Дискретная математика

Знание этого предмета не является обязательным, пункт можно пропустить. Но всё же, вы часто будете встречать некоторые термины как, например, графы. Для уверенного обращения с ними рекомендуется изучить эту тему. Тем же, кого интересует научная сторона Data science и разработка алгоритмов — этот пункт строго обязателен

3. Программирование на Python

Python и R будут вашими основными инструментами для работы. С R вы познакомитесь в курсе статистики, здесь же изучите второй язык

4. Машинное обучение

Время переходить непосредственно к той области, которой хотите заниматься! В этом поможет классический курс от Andrew Ng (Стэнфордский университет) на Coursera. Курс на английском. Если вы его не знаете, можно поискать переводы курса, но рекомендуется начать изучать и язык

5. Получение опыта на Kaggle

Платформа для соревнований по машинному обучению поставит перед вами реальные задачи, а также позволит посмотреть на решения опытных людей. Лучшее место для начала применения своих знаний!

6. Дальнейшее обучение, собеседования

Полистайте список вакансий, подумайте, чего ещё вам не хватает и торопитесь получить работу мечты!

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Больше постов про учёбу, IT и науку — в моём паблике ВК. Там же есть эта статья в более текстовом виде. Буду благодарен за советы и желаю всем удачи!

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Лига образования

1.9K постов 16.6K подписчиков

Правила сообщества

Публиковать могут пользователи с любым рейтингом. Однако мы хотим, чтобы соблюдались следующие условия:

-уважение к читателю и открытость

-публикация недостоверной информации

-конструктивные дискуссии на тему постов

-личные оскорбления и провокации

-неподкрепленные фактами утверждения

Спасибо, выглядит полезно, буду разглядывать.

Удалось ли вам продвинуться в Data Science?

Простите, что в пост годовой давности пишу..

А почему специалистам вы рекомендуете курс от Яндекса и МФТИ, а новичкам от Стэнфорда? Почему не Яндекс последней ступенью?

Яндекс помощь с трудоустройством обещают по окончанию. Или на это вообще не надо обращать внимания?

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Когда пытаешься объяснить клиенту как работает твой алгоритм машинного обучения:

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

«Давайте уже после праздников»

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

А надо ли учиться?

Я понимаю, что даже при покупке курса надо будет что-то почитывать дополнительно, но на сколько это реально, например, для того же, скажем, юриста со знанием английского на уровне Pre-Intermediate?

Так много вопросов, много желания начать учиться и изменить жизнь к лучшему, уйти из старой нелюбимой профессии, и столько же здорового реализма, который заставляет сомневаться в собственных возможностях и оценивает память уже не как свежую студенческую, а немного поношенную, что значительно затруднит процесс. И после работы и нервяков голова тупит уже слегонца. И здоровую прокрастинацию никто не отменял. Поделитесь опытом, пожалуйста.

Пы.Сы. Не бейте сильно, если эта тема уже обсуждалась, а я пропустила или мой вопрос кому-то покажется глуповатым.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Интересная фича

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Обидно

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Только плати

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Ответ на пост «Как войти в IT после 30, мой путь от офисного планктона до Middle Java разработчика в Сбербанке»

Источник

Новая данность: что такое Data Science и зачем она нужна бизнесу

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Что изучает Data Science

Каждый день человечество генерирует примерно 2,5 квинтиллиона байт различных данных. Они создаются буквально при каждом клике и пролистывании страницы, не говоря уже о просмотре видео и фотографий в онлайн-сервисах и соцсетях.

Наука о данных появилась задолго до того, как их объемы превысили все мыслимые прогнозы. Отсчет принято вести с 1966 года, когда в мире появился Комитет по данным для науки и техники — CODATA. Его создали в рамках Международного совета по науке, который ставил своей целью сбор, оценку, хранение и поиск важнейших данных для решения научных и технических задач. В составе комитета работают ученые, профессора крупных университетов и представители академий наук из нескольких стран, включая Россию.

Сам термин Data Science вошел в обиход в середине 1970-х с подачи датского ученого-информатика Петера Наура. Согласно его определению, эта дисциплина изучает жизненный цикл цифровых данных от появления до использования в других областях знаний. Однако со временем это определение стало более широким и гибким.

Data Science (DS) — междисциплинарная область на стыке статистики, математики, системного анализа и машинного обучения, которая охватывает все этапы работы с данными. Она предполагает исследование и анализ сверхбольших массивов информации и ориентирована в первую очередь на получение практических результатов.

В 2010-х годах объемы данных стали расти по экспоненте. Свою роль сыграл целый ряд факторов — от повсеместного распространения мобильного интернета и популярности соцсетей до всеобщей оцифровки сервисов и процессов. В итоге профессия дата-сайентиста быстро превратилась в одну из самых популярных и востребованных. Еще в 2012 году позицию дата-сайентиста журналисты назвали самой привлекательной работой XXI века (The Sexiest Job of the XXI Century).

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Развитие Data Science шло вместе с внедрением технологий Big Data и анализа данных. И хотя эти области часто пересекаются, их не следует путать между собой. Все они предполагают понимание больших массивов информации. Но если аналитика данных отвечает на вопросы о прошлом (например, об изменениях в поведениях клиентов какого-либо интернет-сервиса за последние несколько лет), то Data Science в буквальном смысле смотрит в будущее. Специалисты по DS на основе больших данных могут создавать модели, которые предсказывают, что случится завтра. В том числе и предсказывать спрос на те или иные товары и услуги.

Зачем Data Science бизнесу

Компании используют Data Science вне зависимости от размера бизнеса, показывает статистика Kaggle (профессиональная соцсеть специалистов по работе с данными). А по подсчетам IDC и Hitachi, 78% предприятий подтверждают, что количество анализируемой и используемой информации в последнее время значительно возросло. Бизнес понимает, что неструктурированная информация содержит очень важные для компании знания, способные повлиять на результаты бизнеса, отмечают авторы исследования.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Причем это касается самых разных сфер экономики. Вот лишь несколько примеров отраслей, которые используют Data Science для решения своих задач:

И это лишь самый краткий и поверхностный список использования Data Science. Количество различных кейсов с использованием «науки о данных» увеличивается с каждым годом в геометрической прогрессии.

Каждый интернет-пользователь и просто потребитель ежедневно десятки раз сталкивается с продуктами и решениями, в которых применяются инструменты Data Science. К примеру, аудио-сервис Spotify использует их, чтобы лучше подбирать треки для пользователей в соответствии с их предпочтениями. То же самое можно сказать о предложении фильмов и сериалах на видео-стримингах, таких как Netflix. А в Uber науку о данных рассматривают как инструмент для предиктивной аналитики, прогнозирования спроса, улучшения и автоматизации всех продуктов и клиентского опыта.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Конечно, дата-сайентисты не могут в точности предсказать будущее компании и учесть абсолютно все возможные риски. «Все модели неправильные, но некоторые из них полезны», — иронизировал по этому поводу британский статистик Джордж Бокс. Тем не менее, инструменты Data Science служат хорошей поддержкой для компаний, которые хотят принимать более информированные и обоснованные решения о своем будущем.

Как работают дата-сайентисты

Для работы с данными дата-сайентисты применяют целый комплекс инструментов — пакеты статистического моделирования, различные базы данных, специальное программное обеспечение. Но, главное, они используют технологии искусственного интеллекта и создают модели машинного обучения (нейросети), которые помогают бизнесу анализировать информацию, делать выводы и прогнозировать будущее.

Каждую такую нейросеть необходимо спланировать, построить, оценить, развернуть и только потом перейти к ее обучению. «Сейчас, по нашим оценкам, в процессе работы над ИИ-решениями только 30% времени специалистов уходит на обучение моделей. Все остальное — на подготовку к нему и другую рутину», — говорит CTO «Сбербанк Груп», исполнительный вице-президент и глава блока «Технологии» Давид Рафаловский.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Компания Anaconda, которая разрабатывает продукты для работы с данными, приводит еще более печальную статистику. Ее опросы показывают, что в среднем почти половину времени (45%) специалисты тратят на подготовку данных, то есть их загрузку и очистку. Еще примерно треть уходит на визуализацию данных и выбор модели. На обучение и развертывание остается всего 12% и 11% рабочего времени соответственно.

Дата-сайентисты в облаках

Облегчить и ускорить работу по сбору данных, построению и развертыванию моделей помогают специальные облачные платформы. Именно облачные платформы для машинного обучения стали самым актуальным трендом в Data Science. Поскольку речь идет о больших объемах информации, сложных ML-моделях, о готовых и доступных для работы распределенных команд инструментах, то дата-сайентистами понадобились гибкие, масштабируемые и доступные ресурсы.

Именно для дата-сайентистов облачные провайдеры создали платформы, ориентированные на подготовку и запуск моделей машинного обучения и дальнейшую работу с ними. Пока таких решений немного и одно из них было полностью создано в России. В конце 2020 года компания Sbercloud представила облачную платформу полного цикла разработки и реализации AI-сервисов — ML Space. Платформа содержит набор инструментов и ресурсов для создания, обучения и развертывания моделей машинного обучения — от быстрого подключения к источникам данных до автоматического развертывания обученных моделей на динамически масштабируемых облачных ресурсах SberCloud.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Сейчас ML Space — единственный в мире облачный сервис, позволяющий организовать распределенное обучение на 1000+ GPU. Эту возможность обеспечивает собственный облачный суперкомпьютер SberCloud — «Кристофари». Запущенный в 2019 году «Кристофари» является сейчас самым мощным российским вычислительным кластером и занимает 40 место в мировом рейтинге cуперкомпьютеров TOP500

Платформу уже используют команды разработчиков экосистемы Сбера. Именно с ее помощью было запущено семейство виртуальных ассистентов «Салют». Для их создания с помощью «Кристофари» и ML Space было обучено более 70 различных ASR- моделей (автоматическое распознавание речи) и большое количество моделей Text-to-Speech. Сейчас ML Space доступна для любых коммерческих пользователи, учебных и научных организаций.

«ML Space ­– это настоящий технологический прорыв в области работы с искусственным интеллектом. По нескольким ключевым параметрам ML Space уже превосходит лучшие мировые решения. Я считаю, что сегодня ML Space одна из лучших в мире облачных платформ для машинного обучения. Опытным дата-сайентистам она предоставляет новые удобные инструменты, возможность распределенной работы, автоматизации создания, обучения и внедрения ИИ-моделей. Компаниям и организациям, не имеющим глубокой ML-экспертизы, ML Space дает возможность впервые использовать искусственный интеллект в своих продуктах, приложениях и рабочих процессах», — уверен Отари Меликишвили, лидер продуктового вправления AI Cloud, компании SberCloud.

Облака помогают рынку все шире использовать платформы для работы с данными, предлагая безграничные вычислительные мощности, подтверждают аналитики Mordor Intelligence.

По мнению экспертов из Anaconda, потребуется время, чтобы бизнес и сами специалисты созрели для широкого использования инструментов DS и смогли получить результаты. Но прогресс уже очевиден. «Мы ожидаем, что в ближайшие два-три года Data Science продолжит двигаться к тому, чтобы стать стратегической функцией бизнеса во многих отраслях», — прогнозирует компания.

Источник

История «Data Science». Или как это только не называли

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Data Science — одна из самых востребованных профессий в IT. Она продолжает набирать обороты, хотя отдельной дисциплиной наука о данных стала сравнительно недавно. В эту субботу делимся большим, насыщенным материалом, который поможет узнать или вспомнить о ключевых этапах становления профессии, а освоить её можно здесь.

Придание смысла данным имеет долгую историю и обсуждается учёными, статистиками, библиотекарями, компьютерщиками и другими специалистами на протяжении многих лет. Проследим эволюцию термина «наука о данных», его использование, попытки дать ему определение и связанные термины.

Термин «Data Science» появился совсем недавно [оригинал статьи на английском языке опубликован Forbes в 2013 году] для обозначения новой профессии, которая должна осмыслить огромные хранилища больших данных.

1962 год. В статье «Будущее анализа данных» Джон В. Тьюки пишет:

«Долгое время я считал себя статистиком, интересующимся выводами от частного к общему. Но по мере наблюдения за развитием математической статистики, у меня возникали вопросы и сомнения Я пришёл к выводу, что мой главный интерес заключается в анализе данных

Анализ данных и те разделы статистики, которые его придерживаются, должны… приобрести черты [отдельной] науки, а не математики Анализ данных по своей сути — эмпирическая наука Насколько жизненно важным и насколько значимым… является появление электронного компьютера с хранимыми программами?

Во многих случаях ответ может удивить: «важным, но не жизненно важным», хотя в других случаях нет сомнений в том, что компьютер был «жизненно важным»».

В 1947 году Тьюки ввёл термин «бит», который Клод Шеннон использовал в своей работе 1948 года «Математическая теория связи».

В 1977 году Тьюки публикует книгу Exploratory Data Analysis («Разведывательный анализ данных»), утверждая, что необходимо уделять больше внимания использованию данных, чтобы выдвигать гипотезы для тестирования, а также что разведывательный анализ данных и подтверждающий анализ данных «могут и должны работать бок о бок».

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что этоДжон Тьюки

1974 год. Петер Наур публикует Concise Survey of Computer Methods («Краткий обзор компьютерных методов») в Швеции и США. Книга представляет собой обзор современных методов обработки данных, которые используются в широком спектре приложений. Текст строится вокруг понятия данных, как оно определено Международной федерацией по обработке информации ( IFIP ) в путеводителе по определениям и понятиям обработки данных:

«[Данные — это] представление фактов или идей в формализованном виде, способное передаваться или управляться с помощью какого-либо процесса».

В предисловии книги читатель узнаёт, что на конгрессе IFIP в 1968 году был представлен план курса под названием «Даталогия, наука о данных и процессах данных, её место в образовании»; а также факт, что термин «наука о данных» (data science) используется свободно.

Наур предлагает следующее определение науки о данных: «Наука о работе с данными после их установления, в то время как связь данных с тем, что они представляют, делегируется другим областям [науки] и наукам».

1977 год. Как отдел Международного института статистики (ISI) учреждена Международная ассоциация статистических вычислений (IASC).

«Миссия IASC заключается в том, чтобы объединить традиционную статистическую методологию, современные компьютерные технологии и знания экспертов в данной области в целях преобразования данных в информацию и знания».

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Сентябрь 1994 года. BusinessWeek публикует статью с анонсом на обложке о «Маркетинге баз данных»:

«Компании собирают горы информации о вас, обрабатывают её, чтобы предсказать, насколько вероятно, что вы купите товар. Затем они используют эти знания для составления маркетингового сообщения, точно выверенного, чтобы заставить вас сделать это

Всплеск энтузиазма, вызванный ранее распространением сканеров штрих-кода в 1980-х, закончился всеобщим разочарованием: компании были слишком ошеломлены огромным количеством данных, чтобы сделать с этой информацией нечто полезное Тем не менее многие компании считают, что у них нет другого выбора, кроме как смело ступить в границы маркетинга на основе баз данных».

1996 год. Члены Международной федерации классификационных обществ (IFCS) собрались в Кобе, Япония, на свою конференцию, которую проводили раз в два года. Тогда впервые термин «наука о данных» был включён в название конференции: «Наука о данных, классификация и связанные с ней методы».

IFCS основали в 1985 году шесть классификационных обществ по странам и языкам классификации, одно из которых, The Classification Society (Общество классификации), основали в 1964 году. Классификационные общества в своих публикациях по-разному используют термины «анализ данных» (data analysis), «добыча данных» (data mining) и «наука о данных» (data science).

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

1996 год. Усама Файяд, Григорий Пятецкий-Шапиро, и Падрейк Смит публикуют статью «От добычи данных до обнаружения знаний в базах данных» (From Data Mining to Knowledge Discovery in Databases). Они пишут:

«Исторически понятие поиска полезных закономерностей в данных получило различные названия, включая добычу данных, извлечение знаний, обнаружение информации, сбор информации [information harvesting], археологию данных и извлечение паттернов из данных

По нашему мнению, KDD [обнаружение знаний в базах данных] относится к общему процессу обнаружения полезных знаний из данных в целом, а добыча данных относится к определённому этапу этого процесса.

Добыча данных — это применение конкретных алгоритмов для извлечения закономерностей из данных дополнительные шаги в процессе KDD, такие как подготовка данных, выборка данных, очистка данных, включение соответствующих априорных знаний и правильная интерпретация результатов добычи, необходимые для обеспечения получения полезных знаний из данных.

Слепое применение методов анализа данных (справедливо критикуемое в статистической литературе как драгирование данных) может быть опасным занятием, легко приводящим к обнаружению бессмысленных и бесполезных закономерностей».

1997 год. В своей инаугурационной лекции на должность профессора Гарри К. Карвера Джефф Ву (на момент написания статьи работал в Технологическом институте Джорджии) призывает переименовать статистику в науку о данных, а статистиков — в учёных, изучающих данные [data scientists].

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что этоДжефф Ву

1997 год. Запущен журнал «Добыча данных и обнаружение знаний» (Data Mining and Knowledge Discovery); обратный порядок двух терминов в названии отражает, что «добыча данных» становится более популярным способом обозначения «извлечения информации из больших баз данных».

Декабрь 1999 года. Якоб Захави цитируется в статье «Добыча данных в поисках самородков знаний» (Mining Data for Nuggets of Knowledge) в Knowledge@Wharton:

«Обычные статистические методы хорошо работают с небольшими наборами данных. Однако современные базы данных могут содержать миллионы строк и десятки столбцов

Масштабируемость является огромной проблемой в области добычи данных. Другой технической проблемой является разработка моделей, которые могут лучше анализировать данные, выявлять нелинейные связи и взаимодействие между элементами

Возможно, придётся разработать специальные инструменты добычи данных для решения проблем, связанных с веб-сайтами».

2001 год. Уильям С. Кливленд публикует работу «Наука о данных: план действий по расширению технических областей статистики» (Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics).

Это план «расширения основных направлений технической работы в области статистики». Он амбициозен и предполагает значительные изменения, а изменённая область будет называться «наукой о данных».

Кливленд рассматривает предлагаемую новую дисциплину в контексте компьютерных наук и современной работы в области добычи данных:

«…выгода от аналитики данных была ограничена, потому что знания учёных в области компьютерных наук о том, как думать [в аналитике данных] и подходить к аналитике данных, ограничены, так же как и знания статистиков о вычислительных средах.

Слияние баз знаний создаст мощную силу для инноваций. Это свидетельствует о том, что статистикам сегодня следует обращаться за знаниями к вычислительной технике, как в прошлом наука о данных обращалась к математике.

кафедры науки о данных должны иметь преподавателей, которые посвящают свою карьеру достижениям в области вычислений с данными и устанавливают партнёрские отношения с учёными в области компьютерных наук».

2001 год. Лео Брейман публикует книгу «Статистическое моделирование: две культуры» (Statistical Modeling: The Two Cultures):

«Существуют две культуры в использовании статистического моделирования для получения выводов из данных. В первой предполагается, что данные генерируются заданной стохастической моделью данных. Вторая же использует алгоритмические модели и рассматривает механизм данных как неизвестный.

Статистическое сообщество придерживается первого подхода почти всегда. Эта приверженность привела к неактуальной теории, сомнительным выводам и не позволила статистикам работать над большим количеством интересных текущих проблем.

Алгоритмическое моделирование как в теории, так и на практике быстро развивается в областях за пределами статистики. Оно может использоваться как на больших сложных наборах данных, так и в качестве более точной и информативной альтернативы моделированию на небольших наборах данных. Если наша цель как отрасли науки — использовать данные для решения проблем, то нам нужно отказаться от исключительной зависимости от моделей данных и использовать более разнообразный набор инструментов».

Апрель 2002 года. Запуск Data Science Journal, публикующего работы по «управлению данными и базами данных в науке и технологиях». Сфера журнала включает описание систем данных, их публикацию в интернете, приложения и юридические вопросы. Журнал издаётся Комитетом по науке о данных для науки и технологий (CODATA) Международного совета по науке (ICSU).

Январь 2003 года. Начало работы Journal of Data Science:

«Под «наукой о данных» мы понимаем практически всё, что имеет отношение к данным: их сбор, анализ, моделирование… Но самая важная часть — это применение данных. Этот журнал посвящён применению статистических методов в целом Журнал Journal of Data Science станет платформой для всех работников сферы данных, где они смогут представить свои взгляды и обменяться идеями».

Май 2005 года. Томас Х. Дэвенпорт, Дон Коэн и Эл Джейкобсон публикуют отчёт «Конкуренция на основе аналитики» Исследовательского центра навыков работы Бэбсоновского колледжа, который описывает «появление новой формы конкуренции, основанной на широком применении аналитики и данных, а также на принятии решений на основе фактов

Вместо конкуренции по традиционным факторам компании начинают использовать статистический и количественный анализ и прогнозирование как основные элементы конкурентной борьбы».

Исследование было позже опубликовано Дэвенпортом в Harvard Business Review (январь 2006 года) и расширено (совместно с Жанной Дж. Харрис) до книги Competing on Analytics: The New Science of Winning (март 2007).

В России издавалась под названием «Аналитика как конкурентное преимущество. Новая наука побеждать».

Сентябрь 2005 года. Национальный научный совет (NSF) (США) публикует «Долговременные собрания цифровых данных: включение исследований и образования в XXI веке». Одна из рекомендаций отчёта гласит:

«NSF, работая в партнёрстве с управляющими собраний [данных] и сообществом в целом, должен действовать ради развития и совершенствования карьеры специалистов Data Science и обеспечения того, чтобы исследовательское предприятие включало достаточное количество высоквалифицированных специалистов по работе с данными».

В отчёте даётся следующее определение специалистов по работе с данными:

«Специалисты в области информации и информатики, инженеры и программисты баз данных и программного обеспечения, эксперты по дисциплинам, кураторы и эксперты-аннотаторы, библиотекари, архивисты и другие специалисты, которые имеют решающее значение для успешного управления собранием цифровых данных».

2007 год. В Университете Фудань, Шанхай, Китай, создан Исследовательский центр даталогии и науки о данных.

Здесь мы видим разделение понятий «даталогия» и «Data Science».

В 2009 году два научных сотрудника Центра, Янъюн Чжу и Юнь Сюн, публикуют статью «Введение в даталогию и науку о данных», в которой говорится:

«В отличие от естественных и общественных наук даталогия и наука о данных как объект своих исследований рассматривают данные в киберпространстве. Это новая наука». Центр проводит ежегодные симпозиумы по даталогии и Data Science.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Июль 2008 года. JISC публикует итоговый отчёт об исследовании, которое было проведено по его заказу, чтобы «изучить и дать рекомендации по роли и карьерному росту специалистов по работе с данными и сопутствующему предложению специализированных навыков курирования данных для исследовательского сообщества».

«В заключительном отчёте исследования «Навыки, роль и структура карьеры изучающих данные учёных, а также кураторы: оценка нынешних практик и нужды будущего» учёные, изучающие данные, определяются как «люди, которые работают там, где проводятся исследования — или, в случае персонала центра обработки данных, в тесном сотрудничестве с создателями данных — и могут быть вовлечены в творческий поиск и анализ, предоставляя другим возможность работать с цифровыми данными, и разработки в области технологий баз данных».

Здесь мы сознательно не используем кальку дата-сайентисты, поскольку определение термина дата-сайентист ещё не сформировано до конца [прим. ред.].

Январь 2009 года. Опубликован отчёт Межведомственной рабочей группы по цифровым данным для Комитета по науке Национального совета по науке и технологиям Использование силы цифровых данных для науки и общества. В нём говорится:

«Нации необходимо определить дисциплины и специалистов, а также способствовать появлению новых дисциплин и специалистов, компетентных в решении сложных и динамичных проблем сохранения цифровых данных, устойчивого доступа, повторного использования и перепрофилирования данных.

Во многих дисциплинах наблюдается появление нового типа экспертов в области науки о данных и управления ими, которые работают в компьютерных, информационных науках и науках о данных, а также в других областях. Эти люди являются ключевыми для нынешнего и будущего успеха научного предприятия. Однако они часто не получают признания за свой вклад, а их карьера ограничена».

Январь 2009 года. Хэл Вэриан, главный экономист Google, рассказывает в McKinsey Quarterly: «Я постоянно говорю, что в ближайшие десять лет самой сексуальной профессией будет статистика.

Люди думают, что я шучу, но кто бы мог подумать, что компьютерная инженерия станет самой сексуальной профессией 1990-х годов?

Умение брать данные, понимать их, обрабатывать, извлекать из них ценность, визуализировать, передавать — это будет очень важный навык в ближайшие десятилетия

Потому что сейчас у нас действительно есть практически бесплатные, вездесущие данные.

Поэтому дополнительным дефицитным фактором является способность понимать эти данные и извлекать из них ценность

Я думаю, что эти навыки — способность получать доступ, понимать и передавать информацию, полученную в результате анализа данных, — будут чрезвычайно важны. Управляющие должны иметь возможность самостоятельно получать доступ к данным и понимать их».

Март 2009 года. Кирк Д. Борн и другие астрофизики представили для Десятилетнего обзора «Astro — 2010» работу «Революция в астрономическом образовании: Data Science для масс»:

«Обучение следующего поколения тонкому искусству разумного понимания данных необходимо для успеха науки, сообществ, проектов, агентств, бизнеса и экономики. Это справедливо как для специалистов (учёных), так и для неспециалистов (всех остальных): общественности, преподавателей и студентов, рабочих.

Специалисты должны изучать и применять новые методы исследования науки о данных, чтобы продвинуть наше понимание Вселенной. Неспециалистам необходимы навыки информационной грамотности как продуктивным членам рабочей силы XXI века, интегрирующей основополагающие навыки для обучения на протяжении всей жизни в мире, где все больше доминируют данные».

Май 2009 года. Майк Дрисколл пишет в статье «Три сексуальных навыка гиков данных» (the three sexy skills of data geeks):

«…с наступлением эпохи данных те, кто умеет моделировать, обрабатывать и наглядно представлять данные — назовите нас статистиками или гиками данных — горячий товар». В августе 2010 Дрисколл продолжит книгу «Семь секретов успешных исследователей данных» (the seven secrets of successful data scientists).

Июнь 2009 года. Натан Яу пишет в статье «Восход Data Scientist» (Rise of the Data Scientist):

«Как мы все уже читали, главный экономист Google Хэл Вэриан в январе прокомментировал, что следующей сексуальной профессией в ближайшие 10 лет будет статистика. Очевидно, что я от всей души согласен с этим. Чёрт возьми, я бы сделал ещё один шаг вперёд и сказал, что они сексуальны сейчас — умственно и физически. Однако, если бы вы продолжили читать интервью Вэриана, то узнали бы, что под статистиком он подразумевал человека, способного извлекать информацию из больших массивов данных и затем представлять что-то полезное для неспециалистов в области данных

[Бен] Фрай утверждает необходимость создания совершенно новой области, объединяющей навыки и таланты из часто разобщённых областей знаний [информатика; математика, статистика и добыча данных; графический дизайн; визуализация информации и взаимодействие человека и компьютера]. И после двух лет освещения визуализации на FlowingData кажется, что сотрудничество между областями становится все более распространённым, но, что более важно, вычислительный информационный дизайн становится всё ближе к реальности. Мы видим, как дата-сайентисты — люди, которые могут делать всё это, — выделяются из общей массы».

Обратите внимание на разные регистры понятия Data Scientist. С 2008 года и, как минимум, по 2011 год люди продолжали осторожничать и писать термин в кавычках, курсивом, прописными буквами, хотя в заголовке могли встретиться заглавные.

Статья выше, по-видимому, — осознанная попытка сделать стандартом заглавные буквы. В оригинале её заголовок — Rise of the Data Scientist, а термин data scientist выделен курсивом в попытке определения. Поэтому здесь уместен перевод в виде кальки, чтобы отразить замысел автора, обособить термин. [прим. ред.].

Июнь 2009 года. Трой Садковски создаёт группу data scientists group на LinkedIn как дополнение к своему сайту datasceintists.com, который позже стал datascientists.net.

Февраль 2010 года. Кеннет Кукиер пишет в специальном отчёте The Economist «Данные, данные везде»:

«…Появился новый вид специалистов — дата-сайентист, который сочетает в себе навыки программиста, статистика, рассказчика, чтобы извлекать золотые слитки, скрытые под горами данных».

Июнь 2010 года. Майк Лукидес пишет в статье «Что такое наука о данных?»:

«Учёные, изучающие данные, сочетают в себе предприимчивость с терпением, готовностью к постепенному созданию продуктов данных, способностью к исследованию и итерационному поиску решения.

Они по своей сути междисциплинарны. Они могут решать все аспекты проблемы, от сбора исходных данных и их обработки до формулирования выводов. Они могут мыслить нестандартно, придумывая новые способы рассмотрения проблемы, или работать с очень широко определёнными проблемами: здесь много данных, что вы можете из них сделать?»

Сентябрь 2010 года. Хилари Мейсон и Крис Уиггинс пишут в статье «Таксономия Data Science»:

«…мы подумали, что было бы полезно предложить одну возможную таксономию… того, чем занимается специалист в Data Science, примерно в хронологическом порядке:

Получить, очистить, изучить, смоделировать и понять Наука о данных — это, несомненно, смесь хакерского искусства статистики и машинного обучения… знаний в области математики и в области данных, чтобы анализ был интерпретируемым Она требует творческих решений и непредвзятости в научном контексте».

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Сентябрь 2010 года. Дрю Конвей пишет в статье «Диаграмма Венна для Data Science»:

«…человек должен многому научиться, стремясь стать полностью компетентным специалистом Data Science. К сожалению, простым перечислением текстов и учебников эти узлы не распутать. Поэтому, пытаясь упростить дискуссию и добавить собственные мысли к тому, чем уже переполнен рынок идей, я представляю диаграмму Венна науки о данных хакерские навыки, знание математики и статистики, а также предметный опыт».

Май 2011 года. Пит Уорден пишет в статье «Почему термин «наука о данных» ошибочен, но полезен» (Why the term «data science» is flawed but useful):

«Не существует общепринятой границы того, что входит в рамки науки о данных или не входит в них. Является ли это просто причудливым ребрендингом статистики? Я так не думаю, но у меня также нет полного определения. Я считаю, что недавнее обилие данных породило нечто новое в мире, и, когда я смотрю вокруг, я вижу людей с общими чертами, которые не вписываются в традиционные категории.

Эти люди, как правило, работают за пределами узких специальностей, которые доминируют в корпоративном и институциональном мире, занимаясь всем — от поиска данных, их масштабной обработки, визуализации и написания истории об этих данных.

Они также, похоже, начинают с изучения того, что данные могут им рассказать, а затем выбирают интересные нити, то есть начинают не с традиционного подхода учёного, который сначала выбирает проблему, а затем находит данные, чтобы пролить на неё свет».

Май 2011 года. Дэвид Смит пишет в статье «»Наука о данных»: что в имени тебе моём?» («Data Science»: what’s in a name?):

«Термины «Data Science» и «Data Scientist» вошли в обиход всего чуть больше года назад, но за это время они успели получить широкое распространение: многие компании сейчас нанимают «дата-сайентистов», а под заголовком «наука о данных» проводятся целые конференции.

Но, несмотря на широкое распространение, некоторые сопротивляются переходу от более традиционных терминов, таких как «статистик», количественный аналитик или «аналитик данных»

…Я думаю, «наука о данных» лучше описывает то, чем мы на самом деле занимаемся: сочетание хакерства, анализа данных и решения проблем».

Июнь 2011 года. Мэтью Дж. Грэм на семинаре «Астростатистика и добыча данных в больших астрономических базах данных» с докладом «Искусство науки о данных» (The Art of Data Science) сказал:

«Чтобы процветать в новой, насыщенной данными среде науки XXI века, нам нужно развивать новые навыки Нам нужно понять, каким правилам подчиняются [данные], как они символизируются и передаются и каковы их отношения с физическим пространством и временем».

Сентябрь 2011 года. Харлан Харрис пишет в статье «Data Science, закон Мура и денежный мяч»:

«Наука о данных определяется как то, что делают «Data Scientist».

О том, чем занимаются специалисты в Data Science, очень хорошо рассказано, это включает в себя все этапы: сбор и обработку данных, применение статистики, машинного обучения и связанных с ними методов, интерпретацию, передачу и визуализацию результатов. Кто такие дата-сайентисты — возможно, более фундаментальный вопрос

Мне нравится идея, что Data Science определяется её практиками, что это карьерный путь, а не категория деятельности. В разговорах с людьми мне кажется, что люди, считающие себя специалистами Data Science, обычно имеют эклектичные карьерные пути, которые в некотором смысле могут показаться бессмысленными».

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что это

Сентябрь 2011. Доктор Джанурджай Патил пишет в «Создание команд в науке о данных»:

«В 2008 году мы с Джеффом Хаммербахером (@hackingdata) сели за стол, чтобы поделиться опытом создания групп данных и аналитики в Facebook и LinkedIn. Во многом эта встреча положила начало науке о данных как отдельной профессиональной специализации: мы поняли, что по мере роста наших организаций нам обоим придётся решать, как называть людей в наших командах.

Слово «бизнес-аналитик» оказалось слишком узким. На эту должность претендовал термин «аналитик данных», но мы посчитали, что это название может ограничить возможности людей. В конце концов, многие люди в наших командах обладали глубокими инженерными знаниями.

Учёный-исследователь было разумным названием должности в таких компаниях, как Sun, HP, Xerox, Yahoo и IBM. Однако мы чувствовали, что большинство учёных-исследователей работали над проектами, которые были футуристическими и абстрактными, а работа велась в лабораториях, изолировананных от команд по разработке продуктов.

Могут пройти годы, прежде чем лабораторные исследования повлияют на ключевые продукты, если вообще повлияют. Вместо лабораторных исследований наши команды сосредоточились на работе над приложениями для работы с данными, которые могли бы оказать немедленное и масштабное влияние на бизнес. Термин, который показался наиболее подходящим, — дата-сайентист: для тех, кто использует данные и науку, чтобы создать нечто новое».

Сентябрь 2012 года. Том Дэвенпорт и доктор Джанурджай Патил публикуют статью «Data Scientist: самая сексуальная профессия XXI века» в Harvard Business Review.

Такова краткая история науки о данных, а начать карьеру в Data Science или ML вы можете на наших курсах:

Также вы можете перейти на страницы из каталога, чтобы увидеть, как мы готовим специалистов в других направлениях.

science of learning что это. Смотреть фото science of learning что это. Смотреть картинку science of learning что это. Картинка про science of learning что это. Фото science of learning что этоПрофессии и курсы

Data Science и Machine Learning

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *