Визуализация: от прошлого к будущему. Что такое визуализация данных: какая она бывает и не бывает Правильно работать с открытыми данными

3 D -визуализация уверенно занимает лидирующие позиции в рейтингах наиболее перспективных информационных технологий. Почему этот сегмент решений укрепляет и наращивает свои позиции, что является катализатором спроса, какие новые тенденции формируются в сегодняшних сложных условиях? Об этом мы поговорили с Сергеем Астаховым , руководителем консорциума Interactive Data Visualization Platform (IDVP ), финалиста конкурса «Лучшие информационно-аналитические инструменты - 2016» .

Какие движущие факторы рынка интерактивной визуализации данных являются ключевыми сегодня? Какие тенденции можно выделить?

Драйвером спроса на аналитические инструменты, как ни парадоксально, является сложная экономическая ситуация. В кризисный период руководителям нужно быстро получать точную, объективную информацию о состоянии бизнеса. Другим драйвером рынка является лавинообразный рост объёма данных, что требует новых подходов к работе с информацией.

Сегодня есть потребность в технологиях, которые обладают возможностями обработки больших массивов данных, интерактивной инфографики и имеют интерактивный интерфейс. Пользователи осознали, что визуализация данных и «живое» взаимодействие с ними может наилучшим образом помочь понимать смысл этих данных.

Для этих задач предназначена уникальная российская разработка Interactive Data Visualization Platform (IDVP) - технологическая платформа для оперативной визуализации и анализа данных. Этот управленческий инструмент основан на технологиях функционального моделирования для анализа ситуаций с применением пространственной трёхмерной инфографики. Применяется платформа для решения управленческих, экономических и финансово-хозяйственных задач.

Когда поставщики аналитических решений говорят о клиентских данных, то часто упоминают о проблемах с данными. Но если взять идеальный случай, когда у клиента данные находятся в образцовом порядке, как же отличить важные данные от неважных, влияющие на его непосредственно бизнес-процессы от второстепенных?

Самые «важные» данные получаются из систем, которые используют датчики и счётчики, например в АСУ ТП, системах управления трубопроводами, генерацией энергии и т. д., или из систем, которые автоматизируют операционную деятельность - банковских, платёжных, логистических систем и т. п., где роль человеческого фактора сведена к минимуму либо информация завязана на «живые» деньги.

Собственно, мы пока знаем два способа повышения качества данных: либо минимизировать человеческий фактор - получать данные посредством объективных технических средств, либо завязывать информацию на деньги.

Например, в Центре мониторинга медицинской информационной системы доступность врачей измеряется автоматически в момент записи пациента на приём, без человеческого фактора.

Полнота заведения ресурсов в систему контролируется тоже просто - врач не сможет получить зарплату, если он не заведён в систему и ежедневно не работает в ней. Пока бухгалтерия существовала отдельно от Центра мониторинга, в поликлиниках числилось сотрудников больше, чем вело приёмы. Когда их объединили, все быстро пришло в норму.

Поэтому создание аналитического решения нового поколения практически бессмысленно в отрыве от реорганизации низовой системы, как правило и управленческой, и информационной.

Как вы узнаете уязвимые точки в бизнес-процессах вашего клиента? Для генерального директора важно иметь понимание прошлого, настоящего и прогноза развития его бизнеса, быть в курсе текущих показателей результативности и эффективности. Как вы с этим справляетесь?

В своей работе мы ориентируемся на три основных принципа.

  1. Wow эффект - качество графики, анимация и скорость работы приложения делают работу, как минимум, не скучной. Все элементы разработаны для высококачественного отображения на «больших» экранах, а для руководителей - на мобильных устройствах или ПК.
  2. Ситуационный анализ - возможность быстро локализовать проблему на объектах управления, например по принципу светофора или специфическому изображению.
  3. Возможность не просто локализовать проблему, но и раскрыть все возможные причины её появления, тем самым подтолкнуть к решению проблемы.

Разработка любого аналитического решения - Центра мониторинга, на платформе IDVP начинается с определения кейса, по аналогии с бизнес-кейсом, включающим в себя различные показатели, характеризующие решаемую проблему и показывающие клиенту пути её решения.

Затем, когда сформирован кейс и выбраны показатели для решения проблемы, мы придумываем и разрабатываем трёхмерные интерактивные визуальные образы, которые формируют «пространство явления». Непосредственно за визуализацию данных отвечает специальная программа - «3D плеер», который собирается под управлением платформы индивидуально для каждого пользователя.

IDVP поддерживает достаточно большой набор интерактивных аналитических инструментов. Они имеют возможность масштабирования, изменения положения в пространстве для лучшего визуального восприятия, возможность множественного выбора отображаемых объектов или значений с поддержкой drill-down непосредственно с диаграммы или графика.

Например, для «Центра мониторинга финансовых организаций» мы использовали концепцию визуального графического интерактивного интерфейса «облака» заёмщиков, с которым легко и удобно работать. Размером шарика в облаке кодирована информация о величине полученных кредитов заёмщиком, а цветом - информация о количестве выявленных проблем у заёмщика. Специалист может кликнуть на интересующего его заёмщика и увидеть схему его финансовых отношений с контрагентами в различных разрезах, взаимосвязях и видах.

В приложении «Центр мониторинга «Интеллектуальный склад» используется трёхмерное визуальное представление склада и линейный график с интерактивно изменяемой шкалой.

Фактически это цифровой слепок складского бизнеса, в котором ответы на производственные проблемы представлены в интуитивно понятном виде - например, почему образуются на складе длинные очереди машин на погрузку-разгрузку?

Чем отличается подход к анализу информации в классических аналитических инструментах от вашего решения?

Несмотря на общепринятое позиционирование аналитических систем, традиционно их пользователем является подготовленный аналитик, крутящий «кубики» данных и ищущий в них закономерности. Для анализа данных он использует таблицы, графики, диаграммы и многое другое.

Мы для себя выбрали другого пользователя - это прежде всего топ-руководитель, владелец бизнеса, руководитель отрасли, который постоянно находится в условиях ограниченных временных рамок. Для него скорость принятия управленческих решений зачастую критична. При этом современный занятой человек все чаще хочет воспринимать информацию в виде трёхмерной интерактивной инфографики, позволяющей анализировать максимальные объёмы информации при минимуме временных затрат, быстро улавливать суть проблемы, различные тенденции изменений и оценивать возможные риски. Он привык существовать в трёхмерном пространстве.

Поэтому в наших разработках мы делаем акцент на тех направлениях, которые позволяют быстро и качественно довести до руководителей ситуацию по сложным отраслевым кейсам. с большими объёмами исходных данных. Среди них можно выделить следующие:

Новые приёмы интерактивной визуальной работы с большими массивами оперативной и стратегической информации - технология обеспечивает чёткое восприятие существующих проблем и возможных путей их решения через визуальные образы. На экране одновременно рассматривается множество аспектов, влияющих на проблему, проще понимать информационные, управленческие, финансово-экономические процессы, видна их взаимосвязь и взаимозависимости.

Внедрение элементов геймификации - это новый уровень взаимодействия с пользователем, делающий процесс анализа данных интересным, познавательным и запоминающимся. Соответственно повышается уровень и качество владения информацией.

Использование новых трёхмерных аналитических инструментов , не используемых в традиционных BI-системах ввиду невозможности получения нормального результата на браузерных платформах, например потоковых диаграмм санкей, диаграмм отношений «многие ко многим» и т. п.

Посмотрите сами на примеры интерфейсов наших аналитических систем. Я думаю, что все станет понятно без лишних слов.

СПЕЦПРОЕКТ КОМПАНИИ IDVP

Как легко догадаться из названия, визуализация данных - это графическое представление каких-либо данных. При этом на просторах интернета я нашёл множество определений, которые относят к визуализации данных:

  • Графики и диаграммы,
  • Инфорграфика и схемы,
  • Презентация и анализ данных,
  • Интерактивный сторителлинг,
  • Бизнес аналитика и дашборды,
  • Научная и медицинская визуализация,
  • Карты и картограммы.

Дальше каждый решает сам - что же для него понимать под визуализация данных. В конце заметки, я расскажу, что же решил для себя я. А пока давайте рассмотрим каждый из видов подробнее и найдём их отличия и особенности.

Графики и диаграммы

Наверное самый привычный для нас вид визуализации данных. Используется как для презентации данных, так и для анализа. Встретить их можно и на работе, и в журнале и в научном отчете. Обычно знания о существующих типах диаграмм и графиков мы получаем из школы или из стандартного набора в экселе. Однако, мало кто знает, что мир графиков и диаграмм не ограничивается точечным графиком, столбиковой и круговой диаграммой. Существуют порядка 15 общеизвестных типов диаграмм, а всего их более 60, при этом их количество увеличивается с каждым днём - люди придумывают новые типы для визуализации сложных и необычных данных. Подробно типы графиков и диаграмм мы рассмотрим в одной из следующих заметок.




Инфорграфика и схемы

Инфографика стала очень популярна в последние годы, хотя существуют уже давно. Инфографика относиться к журналистике данных, где графики и схемы объясняют какие-либо факты по выбранной теме. Обычно инфографика статична и представляет собой длинную «простыню» с картинками и текстом. Отличительной особенностью инфографики является то, что в ней приводятся уже готовые выводы, то есть читателя проводят за руку по выбранной теме и при этом приправляют это все цифрами и картинками. Часто используется рисованный или мультяшный стиль. Некоторые СМИ выпускают инфографику на ежедневной основе, например АиФ. Бум инфографики вызвал снижение общего уровня её качества. Часто используется не к месту или «для красоты», хотя конечно же есть замечательные и интересные примеры.

Примеры инфографики

Численность Наполеоновской армии во время русской компании, 1869 г.

Численность населения разных стран, 1912 г.

10 заповедей типографики

Взмах крыльев

Вегетарианцы в цифрах

Презентация и анализ данных

Один самых привычных способов использования визуализации данных - презентация информации в виде диаграмм или инфографики. И если с этим, я думаю, все понятно, то использование визуализации для анализа информации, в основном, используется только бизнес-аналитиками и учеными. В чем же заключается отличие?

При анализе данных с помощью визуализации используют так называемое быстрое прототипирование - то есть создание большого количества различных визуальных представлений одних и тех же данных. Делается это для возможности нахождения скрытых, на первый взгляд, взаимосвязей и зависимостей, а также первичной оценки набора данных для возможности применения в дальнейшем более сложных инструментов анализа. Этот подход называется Eploratory data analysis (EDA), что на русский можно перевести как разведочный анализ данных. Основное отличие от презентации данных - визуализация здесь может быть «черновой» и некрасивой, но выполняется быстро и одним человеком или небольшой рабочей группой. Для этого чаще всего используют эксель, R или матлаб

EDA - один из инструментов data mining’a, по его проведению есть даже учебники

Примеры визуализации для EDA





Интерактивный сторителлинг

Сторителлинг или по-русски сказительство (звучит забавно) - это преподнесение какой-либо полезной информации в форме интересного рассказа. Почему-то часто интерактивным сторителлиногм называют видео, но это не так, это всего-лишь еще один вид инфгорафики. Интерактивный сторителлинг - рассказ с которым слушатель может взаимодейтсовать. По своей сути он близок к журналистике данных и инфографике, но отличается тем, что пользователь может управлять отображением информации и находить те зависимости, которые не нашёл автор. В этом смысле он близок к разведочному анализу данных, но отличается тем, что данные заранее обработаны и представлены в удобном для анализа виде, а также имеются подсказки или заранее прописанные сценарии использования. Поэтому, чаще всего интерактивный сторителлинг называют интерактивной инфографикой, но для того чтобы ей стать не достаточно просто к статичной инфографике добавить всплывающие окошки.
Интерактивные визуализации активно развиваются в наше время. Сильные примеры можно встретить в крупных СМИ или в виде отдельных проектов.

Примеры инетрактивного сторителлинга (переход на сайт при клике на картинку)

Бизнес аналитика и дашборды,

Визуализация активно используется в бизнесе. Принцип «говорите с данными» помогает компаниям зарабатывать больше, а клиентам получать лучший сервис. Для разового анализа обычно используется эксель или R. Однако это не удобно если необходимо следит за какими-то показателями (KPI) на постоянной основе. Для отслеживания рутинных KPI используют дашборды - дисплеи на которых выведены все необходимые показатели в одном месте в виде графиков, диаграмм и таблиц.

Проектирование эффективных дашбордов - сложная и неординарная задача. Зачастую их перегружают ненужной информацией или стараются использовать все возможные типы шаблонных графиков. Часто для того чтобы спроектировать хороший дашборд необходимо создание новых типов визуализации информации. Тематика активно развивается за счет все большего применения аналитики в бизнесе. Также дашборды применяются и для личного использования (фитнес трекеры, анализ личных расходов и т. п.)

Карты - одни из древнейших способов визуализации, отображающих окружающую реальность. Картограмма - карта с нанесенной на неё информацией в виде цвета или других способов. Возможно я тут буду не точен с терминами, да простят меня картографы. Картограммы могут быть использованы для отображения любой информации - от плотности населения, до частоты использования ругательных слов в каждом районе страны. Их могут применять в любом из типов визуализаций, о которых мы говорили раньше. Я выделил их в отдельный пункт, так как их реализация достаточно отличается от других типов визуализаций (ждем про это заметку).

Примеры картограмм (переход на сайт при клике на картинку)

Подводя итоги

Заметка получилась неожиданно большой. Может быть оно и хорошо, сразу видно как много всего в мире визуализации данных. Что же понимаю под этим понятием я и о чем будет речь в данном блоге?
Для меня представление данных в первую очередь связанно с графиками и диаграммами, а также инетрактивной инфографикой. Это то, чему будет посвящена основная масса заметок, также будет интересно покопаться с картами и дашбордами.

Однако если вы примете эти особенности, перед вами раскроются большие возможности. Вы сможете делать графику типографского качества (или по крайней мере на таком уровне, с которого это качество начинается) и полюбите гибкость R. Если вы захотите, то сможете написать свои собственные функции и пакеты, чтобы создавать такую графику, какая нужна именно вам. А можете пользоваться теми, которые другие люди сделали доступными в библиотеке R.

R предоставляет все основные функции рисования, которые, по сути, позволяют создавать практически любые объекты, которые могут вам понадобиться. Во фреймворке рисования вы можете вычерчивать линии, формы и оси, и, опять-таки, как в случае и с другими программными решениями, вы будете ограничены только рамками своего воображения. С помощью разных пакетов R доступны практически все виды диаграмм.

Тогда зачем пользоваться еще чем-нибудь, помимо R? Почему бы не делать с его помощью все? Вот вам несколько причин. R работает на вашем десктопе, так что он не подходит для динамических веб-страниц. Сохранить и разместить диаграммы и изображения на интернет-странице - не проблема, но все это делается отнюдь не автоматически. Вы можете на лету создавать графику прямо в Сети, но на данном этапе существующие для этого решения не слишком устойчивы, особенно если сравнивать их с такими специально разработанными для сети продуктами, как JavaScript.

R также мало подходит для интерактивной графики и анимации. Конечно, вы можете делать с R и это, но существуют более гибкие, более элегантные способы выполнить подобную задачу, например с помощью Flash или Processing.

И наконец, вы, возможно, заметили, что графическим объектам, представленным на рис. 35 и 36, чуточку не хватает лоска. Вы вряд ли когда-нибудь обнаружите подобную графику в газетах или журналах. Вы можете подтянуть дизайн в R до определенного уровня, подключив разные опции или написав дополнительный код, но я сам обычно применяю другую стратегию: я делаю основу графического объекта в R, а затем редактирую его и совершенствую в каком-нибудь приложении для подготовки макетов документов, таком как Adobe Illustrator, - об этом мы еще поговорим далее. Для анализа «сырой» продукт R подходит отлично, но для презентаций и сторителлинга лучше будет немного поработать над эстетикой.

Подсказка. Когда вы будете искать что-нибудь, связанное с R, в интернете, поисковые системы могут иногда не учитывать такое короткое название и выдавать сообщение об ошибке или неправильный результат. Поэтому попробуйте указать в своем запросе «r-project», а не просто «R». Результаты поиска должны оказаться более релевантными.

Компромиссы

Изучать новую программу означает изучать новый язык. Язык, на котором говорит ваш компьютер, - это язык, состоящий из битов и обладающий собственной логикой. Когда вы работаете, например, с Excel или Tableau, вы, по сути, работаете с переводчиком. Интерфейс говорит с вами на вашем языке, и когда вы щелкаете мышью по кнопке, программа переводит команду и затем посылает перевод компьютеру. После чего компьютер выполняет ее и делает для вас что-то, скажем, создает график или обрабатывает какие-то данные.

И здесь время определенно становится серьезным препятствием. Время требуется на изучение нового языка. Для многих людей такое препятствие оказывается непосильным, и я могу их понять. Вам необходимо выполнить работу сейчас, потому что перед вами целая куча данных и люди ждут не дождутся результатов. Если у вас дела обстоят именно так - у вас есть одна-единственная задача, связанная с обработкой данных, и больше таких задач в будущем не предвидится, - тогда, возможно, действительно лучше ограничиться готовыми инструментами для визуализации.

Однако если вы хотите разобраться в ваших данных и вам с большой долей вероятности придется и впредь работать над разными проектами, связанными с обработкой данных, - тогда время, потраченное на изучение программирования сегодня, может завтра обернуться экономией времени для других проектов, которые к тому же будут иметь более впечатляющие результаты. С каждым новым проектом ваши умения в программировании станут совершенствоваться, и оно будет даваться вам все легче и легче. Как и с любым иностранным языком, вы не сразу начинаете писать на нем романы. Нет, вы начнете с азов, а затем постепенно расширите свои знания.

Можно взглянуть на все это и по-другому. Представьте себе, что вас забросили в чужую страну, а вы не говорите на тамошнем языке. Однако у вас есть переводчик. (Выслушайте меня до конца, я говорю по делу.) Чтобы общаться с местными, вам нужно сперва озвучить свою мысль, а затем переводчик должен донести ваше послание. А что делать, если переводчику неизвестно значение только что произнесенного вами слова или он не знает, какое именно слово употребить, чтобы передать сказанное вами? Он может это слово просто опустить или, если он достаточно сообразительный, заглянуть в словарь.

Программа для готовых визуальных решений является тем самым переводчиком. Если она не знает, как делается что-то, то вы оказываетесь в тупике или вам придется попробовать пойти другим путем. В отличие от человека-переводчика, программа неспособна на ходу усваивать новые слова либо, как в нашем случае, новые типы диаграмм и графиков или новые средства обработки данных. Дополнительные функции поступают к ней в виде обновления программы, появления которого приходится ждать. Так почему бы вам самому не выучить язык?

И опять-таки я не призываю вас избегать готовых инструментов. Я сам постоянно ими пользуюсь. Они делают множество нудных задач легкими и быстро разрешимыми, и это здорово. Просто не позволяйте программному обеспечению ограничивать вас.

Как вы убедитесь, читая следующие главы, программирование способно помочь вам проделать больше работы за меньшее время и с меньшими усилиями, чем если вы будете делать все вручную. Конечно, есть и такие задачи, которые лучше делать вручную, особенно когда вы рассказываете истории с помощью данных. И это подводит нас к следующему пункту, который лежит на противоположном конце спектра визуализации: к иллюстрированию.

Иллюстрирование

Давайте заглянем в вотчину графических дизайнеров. Если вы аналитик или у вас более техническая специальность, эта территория для вас, вероятно, незнакомая. Сочетая коды и готовые инструменты визуализации, можно добиться очень многого, но графический объект, который вы в итоге получите, почти всегда будет выглядеть немного грубовато - как нечто, сгенерированное автоматически. Возможно, подписи окажутся не совсем в том месте, или легенда будет немного перегруженной. Для анализа такой результат, как правило, вполне годится - вы же знаете, на что смотрите.

Но когда вы делаете диаграмму или график для презентации, для отчета или для публикации, как правило, вы должны навести лоск, чтобы люди могли четко понять, какую историю вы им рассказываете.

Например, на рис. 35 представлен «сырой» результат работы в R. Он показывает количество просмотров и комментариев на сайте FlowingData для 100 самых популярных постов. Посты рассортированы по категориям. Чем ярче зеленый цвет, тем больше комментариев вызвал конкретный пост, а чем больше размер прямоугольника, тем больше было просмотров. По первому варианту тримапа вы бы об этом не догадались, но когда я смотрел на числа, я знал, что именно я вижу, так как я собственноручно писал этот код.

На рис. 38 представлен переработанный вариант того же тримапа. Названия размещены так, чтобы их было видно; наверху я добавил вводный текст, чтобы читатели понимали, что это такое перед ними; красный участок цветовой легенды я удалил вовсе, так как это нонсенс - пост с отрицательным количеством комментариев. А еще я изменил фон с серого на белый просто потому, что мне показалось - так будет лучше.

Рис. 38. Тримап, созданный в R и отредактированный в Adobe Illustrator

Я мог бы отредактировать код таким образом, чтобы он отвечал всем моим потребностям, но было намного проще щелкнуть мышью по объекту и перетащить его в Adobe Illustrator. Вы можете с нуля создать график или диаграмму в программе для работы с иллюстрациями, а можете импортировать в нее графический объект, который вы разработали, скажем, в R, и отредактировать его так, как вам хочется. В первом случае вы ограничены в выборе вариантов, так как визуализация не является первоочередной задачей данной категории программного обеспечения. Для всего, что сложнее столбцовой диаграммы, вам лучше будет прибегнуть к импорту. В противном случае вам придется очень многое делать вручную, а это чревато ошибками.

Что хорошо в использовании программ - графических редакторов, так это то, что вы лучше контролируете отдельные элементы и все можете делать методом перетаскивания (drag and drop). Поменять цвет столбцов или одного-единственного столбца, увеличить или уменьшить толщину осевых линий, снабдить примечаниями самые важные характеристики - и все это несколькими щелчками мыши.

Опции

Существует много программ для работы с иллюстрациями, но среди них таких, которые бы использовало большинство людей, всего несколько, а используемая повсеместно - и вовсе одна. Скорее всего, решающим фактором для вас будет цена. Цены варьируются от нуля (бесплатные программы с открытым исходным кодом) до нескольких сотен долларов.

ADOBE ILLUSTRATOR

Любая графика, построенная на статистических данных, которая выглядит как сделанная на заказ или появляется в том или ином крупном издании, скорее всего, на одном из этапов прошла обработку в Adobe Illustrator. Эта программа - отраслевой стандарт. Каждый графический объект, который печатается на страницах New York Times, был или создан, или отредактирован в Illustrator.

Популярность Illustrator в типографском деле объясняется тем, что в данной программе вы работаете с векторами, а не с пикселами. Это означает, что вы можете создавать большие графические объекты без снижения качества изображения. Пример обратного - это когда вам приходится увеличивать фотографию с низким разрешением, и в итоге вы получаете изображение, разбитое на цветные квадратики-пикселы.

Данная программа изначально была разработана для конструирования шрифтов, но позже обрела популярность у дизайнеров-иллюстраторов как средство для создания логотипов и арт-графики. И именно для этого Adobe Illustrator главным образом используется и по сей день.

Тем не менее программа предоставляет доступ к некоторым основным функциональным возможностям визуализации данных через инструмент Graph (Диаграмма). С его помощью вы можете создавать практически все основные типы диаграмм и графиков, такие как гистограммы, круговые диаграммы и диаграммы временны"х рядов. Вам нужно ввести числа в маленькую таблицу, однако этим и исчерпываются возможности управления данными.

Лучшее, что есть в Illustrator в плане информационной графики, - это гибкость и легкость работы при наличии большого числа кнопок и функциональных возможностей. Поначалу их обилие может несколько смутить вас, но в них можно быстро освоиться, и вы в этом сами убедитесь, прочитав четвертую главу («Визуализация паттернов во времени»). Именно эта гибкость позволяет лучшим дизайнерам информационной графики создавать лаконичные и понятные объекты.

Illustrator существует в варианте для Windows и для Mac. Однако у данной программы есть и один недостаток: она недешевая. Особенно высокой цена начинает казаться тогда, когда подумаешь, сколько всего можно сделать с помощью кода, который вообще бесплатен (при условии, что у вас уже есть машина, на которую его можно загрузить). Однако если сравнивать по цене данную программу с другими готовыми решениями, Illustrator не покажется таким уж дорогим.

На момент написания книги самая свежая версия Illustrator стоила на сайте Adobe 599 долларов США, в других местах можно было получить значительные скидки (или взять себе более старую версию). Кроме того, Adobe предлагает существенные скидки студентам и другим членам научного сообщества, так что, возможно, программа достанется вам существенно дешевле. (Это самая дорогая программа, которую я когда-либо покупал, но я использую ее почти ежедневно.)

INKSCAPE

Inkscape - это бесплатная (с открытым исходным кодом) альтернатива Adobe Illustrator. Если вы хотите обойтись без затрат, тогда Inkscape - ваш лучший выбор. Я всегда пользуюсь Illustrator, потому что когда я только начинал осваивать тонкости информационной графики, все пользовались именно им, и это показалось мне самым разумным вариантом действий. Но я слышал хорошие отзывы об Inkscape, и, поскольку программа бесплатная, не будет вреда, если попробуете ее. Только не надейтесь найти такое же, как для Illustrator, количество учебных веб-ресурсов на эту тему.

ДРУГИЕ

Illustrator и Inkscape, безусловно, не единственные программы, с помощью которых можно создавать и доводить до блеска свои диаграммы и графики. Просто ими пользуется большинство людей. Но есть и специалисты, которые предпочитают Corel Draw. Данная программа существует только в варианте для Windows и стоит примерно столько же, сколько и Illustrator. Можно найти ее и чуть подешевле, если знать, где искать.

Существуют и другие программы, такие как Raven от Aviary и Lineform, но они предлагают меньший набор инструментов. Помните, что Illustrator и Inkscape - это основные инструменты графических дизайнеров, и они обладают наиболее богатым функционалом. Но если вы хотите всего лишь чуть подкорректировать парочку существующих диаграмм, тогда можете выбрать и более простое (дешевое) программное обеспечение.

Компромиссы

Программы типа Illustrator и Inkscape предназначены лишь для одного: для иллюстрирования. Они не созданы специально для разработки информационной графики. Их основная задача - графический дизайн, а потому многие люди не пользуются всеми функциональными возможностями, предлагаемыми Illustrator и Inkscape. Обе они также не очень хорошо подходят для управления большими массивами данных и не выдерживают сравнения ни с программами, которые вы сами пишете для конкретных целей, ни с другими инструментами, которые специально созданы для визуализации данных. Иными словами, графические редакторы необходимы, если вы хотите делать графику достаточно высокого уровня, чтобы ее можно было публиковать. Они помогают не только в плане эстетики, но также делают объект более читабельным и понятным, чего часто сложно добиться, работая с автоматически сгенерированными результатами.

Маппинг

Возможности инструментов для маппинга частично совпадают с возможностями инструментов для визуализации, о которых мы говорили выше. Однако в последние годы объемы географических данных значительно возросли, а вместе с ними увеличилось и количество способов, которыми можно пользоваться для создания карт. Услуги мобильного позиционирования находятся на подъеме, все больше становятся массивы данных с привязанными к ним широтой и долготой. Помимо прочего, карты - невероятно интуитивный способ визуализации данных, и они заслуживают более внимательного рассмотрения. В первые годы существования Сети создание карт было дело непростым. Да и результат не отличался элегантностью. Вы помните те дни, когда приходилось обращаться к MapQuest, выполнять массу инструкций и в конечном итоге получать малюсенькую статичную карту? В какой-то момент и у Yahoo был такой сервис. Длилось это до тех пор, пока Google не реализовал принцип подвижной карты(рис. 39). Хотя технология была изобретена раньше, она не находила применения, пока скорость интернета у большинства людей не выросла достаточно, чтобы обеспечивать непрерывное обновление данных. Сегодня мы уже привыкли к подвижным картам. Мы с легкостью их прокручиваем и увеличиваем, а в некоторых случаях карты оказываются нужны нам не только для определения направления движения - они становятся основным интерфейсом для просмотра набора данных.

Рис. 39. На Google Maps можно получить также и инструкции

Примечаеие. Подвижные карты - это принцип реализации картографических данных, который сегодня стал практически универсальным. Большие карты, которые в иной ситуации не поместились бы на экране, делятся на меньшие изображения (или тайлы). Вы видите только те тайлы, которые приходятся на ваше окно, а все остальные спрятаны. Однако стоит только протащить карту мышью, как появляются другие тайлы, и таким образом создается впечатление, что вы перемещаетесь по одной большой карте. Подобный принцип отображения вы могли видеть также и при просмотре фотографий с высоким разрешением.

Опции

По мере того как географические данные все больше становятся общественным достоянием, появляются все новые и все более разнообразные инструменты для составления карт с применением этих данных. В случае с некоторыми из них требуется всего лишь толика умений в области программирования, чтобы можно было с их помощью что-то создать и это что-то запустить. Работа с иными инструментами предполагает несколько бо"льшие вложения труда и времени. Но существуют также и решения, не требующие программистских навыков.

КАРТЫ GOOGLE, YAHOO И MICROSOFT

Это самое простое онлайновое решение, но и оно требует, чтобы вы хоть немного ориентировались в программировании. Чем лучше вы умеете писать коды, тем большего вы сможете добиться с помощью API для создания карт, предлагаемых Google, Yahoo и Microsoft.

Основной функционал во всех трех случаях довольно схож, но если вы делаете только первые шаги на данном поприще, я рекомендую вам начать с Google. Мне кажется, это самый надежный вариант. У Google есть API для создания карт как на JavaScript, так и на базе Flash, а помимо этого еще и другие связанные с географией сервисы, такие как геокодирование и прокладывание маршрутов. Просмотрите обучающее руководство о том, как начать работу с системой, а затем уже углубляйтесь в изучение других тем, таких, например, как наносить метки, находить оптимальные маршруты и добавлять слои. Всеобъемлющие инструкции с фрагментами кодов и рекомендациями помогут вам быстро освоиться.

Рис. 40. Нанесение меток на Google Maps

У Yahoo также имеется API для создания карт с помощью JavaScript и Flash плюс некоторое количество геосервисов, но я не уверен, как долго они будут доступны, учитывая текущее состояние компании. Когда писалась эта книга, Yahoo переключила свое внимание с разработки приложений на контент-провайдинг. Microsoft также предлагает API для JavaScript (с названием Bing) и еще одно для Silverlight - платформы, которая разрабатывалась этой корпорацией как ответ на Flash.

Упомянутые выше онлайн-сервисы для создания карт довольно незатейливы в плане того, что они вообще умеют делать. Если вам нужно создавать более сложные карты, вам, скорее всего, придется самостоятельно реализовывать функционал. Однако есть еще ArcGIS, которая разрабатывалась как настольное приложение для создания карт. Это увесистая программа, которая позволяет переносить на карту огромное количество данных и выполнять множество действий, таких как сглаживание и обработка. Все это вы можете делать через пользовательский интерфейс, так что вам не потребуется писать коды.

Почти все службы и отделы графики, в которых работают специалисты по созданию карт, используют ArcGIS. Некоторые люди без ума от нее. Так что если вы интересуетесь созданием детальных карт, вам стоит присмотреться к ArcGIS.

Я использовал ArcGIS в работе над несколькими проектами, потому что я предпочитаю идти «программным путем» и мне все эти функциональные возможности просто были не нужны. У такого богатого инструментария есть и обратная сторона: приходится иметь дело с таким же большим количеством кнопок и меню. Имеются в наличии также онлайн- и серверные решения, но в сравнении с другими разработками они кажутся несколько неуклюжими.

MODEST MAPS

Я уже упоминал Modest Maps выше, когда приводил пример, представленный на рис. 29. В нем демонстрировался рост торговой сети Walmart. Modest Maps - это Flash- и ActionScript-библиотека для карт на основе тайлов, и она также совместима с Python. Библиотека поддерживается группой людей, которые разбираются в онлайн-маппинге и делают прекрасную работу как для своих клиентов, так и для собственного удовольствия, а это многое говорит о качестве библиотеки.

Самое забавное то, что Modest Maps - это в большей степени фреймворк, нежели API для создания карт вроде тех, что предлагает Google. Она обеспечивает абсолютный минимум того, что необходимо для создания онлайн-карты, а после уже не вмешивается в вашу работу и предоставляет вам возможность реализовать то, что вы хотите. Вы можете использовать тайлы от разных провайдеров, а можете кастомизировать карту так, чтобы она подходила для вашего приложения. Например, на рис. 29 представлена карта в сине-черном оформлении, но вы можете с легкостью поменять ее на бело-красную, как это показано на рис. 41.

Рис. 41. Карта в бело-красном оформлении с использованием Modest Maps

Modest Maps распространяется на условиях лицензии BSD, так что вы можете делать с ней все, что захотите, совершенно бесплатно. Правда, для этого вам необходимо будет научиться работать с Flash и ActionScript, но о них мы еще поговорим в восьмой главе («Визуализация пространственных отношений»).

POLYMAPS

Polymaps - это своего рода JavaScript-версия библиотеки Modest Maps. Она была разработана и поддерживается отчасти теми же самыми людьми и предлагает примерно тот же функционал, но и много чего еще в придачу. Modest Maps предоставляет только базовый функционал в области создания карт, в то время как Polymaps имеет такие встроенные функции, как картограммы (рис. 42) и пузырьковые диаграммы.

Рис. 42. Картограмма, демонстрирующая уровень безработицы, реализованная в Polymaps

Поскольку все это JavaScript, объект кажется более легким (так как требует меньше строк кода) и работает в современных браузерах. Для демонстрации данных Polymaps использует масштабируемую векторную графику (SVG), а потому не работает в старых версиях Internet Explorer, хотя большинство людей идет в ногу со временем. К слову сказать, только 5% посетителей сайта FlowingData пользуются устаревшими веб-браузерами, и я подозреваю, что вскоре их количество упадет до нуля.

Лично я в библиотеках для создания карт на JavaScript ценю больше всего то, что код выполняется в браузерах без сучка и задоринки. Вам ничего не приходится делать - никакого компилирования, никакого экспорта Flash. В результате все легко запускается и легко обновляется.

В базовом варианте распространения R не обладает функционалом для создания карт, но существует несколько пакетов, которые позволяют вам заниматься в R также и маппингом. На рис. 43 представлена маленькая карта, которую я сделал в R. Аннотации были добавлены позже, уже в Adobe Illustrator.

Рис. 43. Карта США, созданная в R

Карты, сделанные в R, ограничены в возможностях, да и документация там не на высоте, так что я использую этот способ создания карт, только если мне нужно сделать что-то несложное и по случайности я в этот момент как раз работаю с R. В остальных случаях я предпочитаю прибегать к инструментам, о которых я уже говорил выше.

ОНЛАЙН-РЕШЕНИЯ

Существует также несколько онлайн-решений для создания карт, которые позволяют с легкостью визуализировать географические данные. В большинстве случаев они берут за основу карты, которые люди используют чаще всего, и удаляют с них все лишнее. Получается нечто похожее на упрощенный ArcGIS. К двум из этих ресурсов доступ свободный. Это Many Eyes и GeoCommons. Первый из них - о нем мы говорили выше - обладает лишь базовым функционалом для работы с данными по странам или по штатам США. А вот GeoCommons предоставляет более широкие функциональные возможности и более богатый инструментарий для взаимодействия. А еще GeoCommons поддерживает самые распространенные форматы файлов с картографическими данными, такие как шейп-файлы и KML.

Имеется также множество платных решений, самые полезные из них - это Indiemapper и SpatialKey. SpatialKey пригоден в большей степени для бизнеса и принятия решений, в то время как Indiemapper отлично подходит для задач картографов и дизайнеров. На рис. 44 представлен пример картограммы, которую я состряпал в Indiemapper всего за несколько минут.

Рис. 44. Картограмма, созданная в Indiemapper

Компромиссы

Программы для создания карт встречаются самых разных видов и предназначены для удовлетворения различных потребностей. Было бы замечательно - освоить одну-единственную программу и иметь возможность создавать все мыслимые виды карт. К несчастью, так не получится.

ArcGIS, например, обладает множеством функций, но вам, возможно, не стоит тратить время на ее изучение и деньги на ее покупку, если нужно создавать только простенькие карты. А вот бесплатный R с его базовым функционалом, наоборот, может оказаться слишком простым для того, что вы хотите сделать. Если ваша цель - интерактивные онлайн-карты, вас вполне могут устроить Modest Maps и Polymaps, но тогда вам понадобятся более серьезные навыки в сфере программирования.

Изучите имеющиеся возможности

Данный перечень инструментов отнюдь не исчерпывает все варианты, которыми вы можете пользоваться для визуализации данных, но на первых порах вам его должно хватить. Тут есть много о чем подумать и много с чем поиграть. То, какими инструментами вы в конечном счете будете пользоваться, во многом зависит от того, чего вы хотите добиться, причем всегда есть множество подходов к выполнению задачи даже в рамках одной-единственной программы. Хотите создать статичную информационную диаграмму? Может быть, стоит остановиться на R или Illustrator. Хотите построить интерактивный инструмент для веб-приложения? Тогда попробуйте JavaScript или Flash.

На сайте FlowingData я провел опрос, пытаясь выяснить, чем люди в основном пользуются для анализа и визуализации данных. Ответили чуть более 1000 человек. Результаты представлены на рис. 45.

Рис. 45. Что используют читатели FlowingData для анализа и визуализации данных

Среди ответов есть несколько очевидных лидеров, особенно учитывая тематику FlowingData. На первом месте идет Excel, за ним следует R. А дальше во мнениях и предпочтениях при выборе программного обеспечения наступает разнобой. Более 200 человек выбрали категорию «Другое». В своих комментариях многие заявляли о том, что они комбинируют инструменты для удовлетворения разных потребностей - а в долгосрочном плане это обычно является наиболее эффективным подходом.

Комбинирование возможностей

Многие любят работать только с одной программой - это легко и удобно. Не нужно изучать ничего нового. Если этого хватает для удовлетворения ваших потребностей в области визуализации, тогда не надо отступать от данного принципа. Но после тогокак вы поработаете с данными достаточно долго, наступит момент, когда вы поймете, что возможности программного обеспечения исчерпаны. Вы будете знать, что нужно сделать с данными или как их визуализировать, однако программа не позволит вам это осуществить или сделает процесс более трудоемким, чем следовало бы.

Вы можете смириться с таким положением, а можете начать использовать другие программы, на изучение которых уйдет время, но которые помогут вам осуществить свой дизайнерский замысел. Я вам предлагаю пойти вторым путем. Владение разнообразными инструментами гарантирует, что вы не запутаетесь в данных и что вам хватит гибкости, чтобы выполнять все многообразие визуальных задач и получать реальные результаты.

Закругляясь

Помните: ни один из этих инструментов не панацея. В конечном итоге анализ данных и дизайн всегда будут зависеть от вас. Ведь инструменты являются всего лишь инструментами. То, что у вас есть молоток, вовсе не означает, что вы способны построить дом. Точно так же вы можете иметь в своем распоряжении отличную программу и суперкомпьютер, но если вы не будете знать, как пользоваться этими инструментами, считайте, что их у вас нет. Именно вы решаете, какие вопросы задавать, какие данные использовать и какие их грани высветить, а понимание этого приходит с опытом.

Но вам повезло! Ведь именно этому посвящена вся оставшаяся часть книги. В следующих главах вы познакомитесь с основными концепциями информационного дизайна и научитесь, как претворять теорию на практике, применяя ту или иную комбинацию инструментов, о которых мы говорили выше. Вы узнаете, что именно нужно искать в имеющихся у вас данных и как эти данные визуализировать.

Потоковый график (streamgraph) - разновидность штабельной диаграммы с областями, выстроенной со смещением вокруг центральной оси, в результате чего возникают красивые плавные формы (особенно при работе с большими массивами данных). Разработан Ли Байроном в 2008 году. Генератор можно скачать с GitHub . Прим. пер.

Количество доступных на сегодня источников данных и инструментов для их обработки само по себе уже наглядно показывает, что ещё никогда столько людей не пыталось освоиться в мире визуализации данных. А когда есть такое число материалов, доступных к изучению, один только вопрос «С чего начать?» может напугать каждого новичка. Итак, какие же библиотеки являются лучшими и что советуют профессионалы? Об этом и пойдёт речь в данной статье.

Говорить о визуализации данных и не упомянуть – это всё равно, что рассказывать об истории создания персональных компьютеров и ни словом не обмолвиться о Стиве Джобсе. D3 (от англ. Data Driven Documents) – это без преувеличения самая важная и доминирующая на рынке JavaScript библиотека с открытым исходным кодом, которая обычно используется для создания SVG-графиков. SVG (от англ. Scalable Vector Graphics) – это в свою очередь формат векторного изображения, поддерживаемый веб-браузерами, но ранее мало использовавшийся.

Библиотека D3 во многом обязана своей популярностью внезапному интересу к SVG со стороны веб-дизайнеров, что в значительной степени объясняется тем, как выигрышно векторные графики выглядят на экранах с большим разрешением (в частности, на Retina-дисплеях, используемых в устройствах Apple), которые становятся всё более распространёнными.

«Будем честными, если задача состоит в визуализации данных на основе SVG, то для её решения все остальные библиотеки даже рядом не стояли», – говорит Moritz Stefaner , независимый эксперт в области визуализации данных и владелец компании Truth & Beauty . «Есть также немало интересных проектов, созданных на базе D3, как, например, NVD3 , который предоставляет стандартные графические компоненты – готовые к использованию, но кастомизируемые; или, скажем, Crossfilter – просто выдающийся инструмент для фильтрации данных».

Processing.js – это «родственный» проект Processing, который позволяет визуализировать данные, используя веб-стандарты и исключая необходимость в каких-либо плагинах. «Для того, чтобы начать работать с Processing, вам не нужно знать JavaScript, потому что у Processing свой собственный язык программирования», – поясняет эксперт по визуализации данных из Нидерландов Jan Willem Tulp . Как пользователь, вы просто пишете код на языке Processing, вставляете его на свою веб-страницу и спокойно позволяете Processing.js позаботиться обо всём остальном».

«Отрицательный момент ожидает вас, когда вы начнёте работать над более сложными проектами: IDE (от англ. Integrated Development Environment) покажется вам немного ограниченным», – продолжает Jan Willem Tulp.

И несмотря на это, свойственная Processing простота, а также многочисленное пользовательское сообщество, в любой момент готовое помочь тем, кто столкнулся с проблемой, сглаживают указанный недостаток и делают Processing одним из самых доступных инструментариев для визуализации данных.

В то время как D3 и Processing предоставляют общие инструменты для различных типов визуализации, Gephi решает более конкретные задачи. Gephi – это бесплатная библиотека с открытым исходным кодом, предназначенная для сетевой визуализации. Но даже в рамках этой узкой специфики Gephi предоставляет море возможностей. Хотите ли вы смоделировать взаимоотношения сотрудников внутри компании или передачи мячей во время футбольного матча, с помощью Gephi вы сможете визуализировать подобные взаимосвязи.

Как и Processing, Gephi очень прост в установке. Сразу после установки следует непосредственно импорт данных, их сортировка, и можно приступать к визуализации. «Получившиеся изображения могут быть экспортированы и вставлены в любой веб-документ, чтобы ваша аудитория могла в дальнейшем использовать их и делиться ими в сетях», – говорит Benjamin Wiederkehr.

Dygraphs

Dygraphs – это быстрая и гибкая в использовании JavaScript библиотека с открытым исходным кодом, предназначенная для построения интерактивных графиков и позволяющая анализировать и интерпретировать очень плотные массивы данных. В отличие от Vega, библиотека Dygraphs предлагает кастомные настройки, но обладает тем же преимуществом работы во всех основных браузерах. Кроме того, Dygraphs изначально интерактивна, а это значит, что некоторые функции (например, zoom, pan или mouseover) присутствуют по умолчанию, в то время как, скажем, функция “pinch-to-zoom” на мобильных устройствах – это уже просто приятный бонус.

С чего начать?

Даже при наличии такой информации мир визуализации данных может показаться новичку тёмным лесом. Так что же советуют эксперты?

«Первое, что я бы посоветовал, это познакомиться с максимальным количеством существующих на сегодня инструментов, чтобы быстро создавать стандартные графы», – говорит Moritz Stefaner. «Особенно на начальном этапе проекта очень важно иметь возможность быстро генерировать много диаграмм с целью изучения объёма, глубины и «текстуры» данных. Лично я использую Tableau и Gephi, но помимо них ещё CartoDB , незаменимый для работы с картами, и совсем недавно появившуюся библиотеку с открытым кодом RAW , отлично подходящую для быстрого создания интересных графов».

Также необходимо убедиться, что выбранная библиотека оптимально подходит для информации, которую вам предстоит отобразить.

«Очень важно с самого начала спросить себя, с каким именно форматом данных вам предстоит работать», – говорит Scott Murray. «Задача стоит в визуализации временного отрезка? Может быть это категориальные данные? Ответы на подобные вопросы могут повлиять на ваше решение. Некоторые библиотеки, вроде D3, универсальны и могут работать с различными типами данных. Другие же более специфичны в отношении типов данных, например, Gephi или Sigma.js – инструменты, предназначенные для сетевой визуализации. Если вы знаете с самого начала, с чем вы работаете, вдумчиво выбирайте из существующих библиотек ту, которая лучше всего подойдёт для вашего типа данных».

В чём плюсы онлайн комьюнити?

Для тех, кто только начинает заниматься визуализацией данных, важным пунктом в выборе библиотеки является наличие локального комьюнити, участники которого увлечены своим делом и готовы помочь.

«Начинающим я бы посоветовал для старта библиотеки Processing или D3», – говорит Jan Willem Tulp. «Обе они располагают большой пользовательской базой и солидным числом примеров, на которых можно поучиться».

Онлайн комьюнити в сфере визуализации данных не только даёт ответы на многие вопросы, но и наглядно демонстрирует один из главных парадоксов инфографики. Каждый приходит в отрасль со своим образованием и опытом, поэтому некоторые специалисты в области визуализации данных подходят к задачам с эстетической и художественной точек зрения, в то время как другие концентрируются на статистической составляющей вопроса. Статистики отлично разбираются в больших объёмах данных, но вынуждены изучать основы дизайна. Дизайнеры знают многое о создании эстетически привлекательных изображений, но им предстоит многое узнать о статистических методах.

«В центре всего – соглашение сторон о типе визуализации», – говорит программист-дизайнер

Сегодня в области визуализации исследуются методы преобразования данных в визуальные образы для лучшего понимания информации. Одно из самых распространенных визуальных представлений – линейная диаграмма – используется уже более тысячи лет. А такие инструменты, как столбчатая и круговая диаграмма, диаграмма рассеяния и гистограмма, были изобретены более двух веков назад.

С тех пор прошло много времени, и прогресс не стоял на месте. Сейчас в распоряжении пользователей – десятки программ, позволяющих визуализировать данные. При этом визуализация давно «перекочевала» в трехмерное пространство: ученые применяют ее для наглядного представления результатов исследований, метеорологи составляют погодные карты, руководители используют 3D-модели данных для принятия быстрых и эффективных управленческих решений.

Но остановится ли на этом процесс развития технологий визуализации? Конечно, нет. Что нас ждет в будущем? Ответ на этот вопрос можно найти, проследив историю визуализации, ведь не зря говорят: «Без знаний прошлого нет будущего».

Краткий экскурс в историю

Поскольку мы с вами говорим о визуализации, давайте и ее историю представим в наглядном виде – именно так ее изобразил Майкл Фрэндли (Michael Friendly), автор книги Handbook of Data Visualization:

До 17 века – Ранние карты и диаграммы

Первое зерно визуализации зародилось в геометрических диаграммах, в таблицах положений звезд, иллюстрациях частей тела и навигационных картах.

Среди ранних отображений количественной информации есть график перемещения звездных тел, где в двумерной системе координат показано движение планет. Этот график служит хорошей иллюстрацией данного периода:

1600-1699 – Измерения и теории

В XVII веке ученых интересовало, как измерить время, расстояние и пространство. Основной упор делался на карты и навигацию.

Именно в этот период появилась система координат, родилась теория верности и демографическая статистика.

Иллюстрацией того времени может послужить работа Кристофера Шайнера (Christopher Scheiner), датированная 1630 годом. Позднее Эдвард Тафти использовал для нее термин «маленькие множества», подразумевая под ним повторение одного элемента много раз для отображения динамики и происходящих изменений.

На этом рисунке запечатлены пятна на солнце, наблюдавшиеся в течение месяца:

1700-1799 – Новые графические формы

XVIII век – время выхода за рамки «очевидного». На картах теперь стараются отобразить не просто точку географического местоположения, появляются контуры и изолинии.

Примеры эпохи: тематические карты геологических разломов, экономические выкладки и медицинские иллюстрации. Абстрактные визуализации становятся все более распространенными. Начинает накапливаться больше информации о политических и экономических событиях, соответственно возникает необходимость в новых визуальных формах для их отображения.

Ниже – один из первых примеров наложения дополнительных данных на географическую карту:

1850 – Начало современной графики

К этому времени появились основные виды графиков: круговая, столбиковая, площадная диаграммы. Отправной точкой современной графики считается знаменитая визуализация холеры на улицах Лондона, сделанная Джоном Сноу:

В 1858 году сестра милосердия и общественный деятель Великобритании Флоренс Найтингейл изобрела первую круговую диаграмму — ее она использовала в Крымской войне с целью показать, что намного больше солдат умерло от болезней (синий), чем на поле боя (красный) или по другим причинам (черный):

1900-1950 – Смутные годы

Начались философские рассуждения и деление людей на «более визуальных» и «более табличных». Британцы считали себя более табличными. Девизом Британской академии в те времена был сбор данных («сбор пшеничных зерен»), а вот визуализация на их взгляд была уже из серии хлебопекарни.

1950 – 1975 – Возрождение

Ученые и писатели начали активно популяризировать идеи визуализации. Подобные труды выходили буквально один за одним. В 1962 году Джон Тьюки написал книгу «Будущее анализа данных», отделив математику от статистики. И если первая не терпит визуализаций, то статистика как раз обретает больший смысл и форму благодаря им.

В это время появляются первые интерактивные визуализации. Примером может служить визуализация Ричарда Бейкера:

В 1973 году американский ученый Герман Чернов использовал изображения лиц для визуализации данных. Лица Чернова - это отображение многомерных данных в виде человеческого лица, его отдельных частей. Ниже — пример оценки юристами 12 судей по Лицам Чернова:

1975 – н.в. – Интерактивная и динамическая визуализация высокого разрешения

Сегодня мы имеем широкий доступ к инструментам анализа и визуализации данных. Ключевыми моментами, которые ознаменовали эпоху интерактивной и динамической визуализации, можно считать возникновение интерактивных систем, возможность взаимодействовать с моделями (в том числе и 3D), увеличение мощности компьютеров наравне с удешевлением технологий.

Безусловно, ключевую роль в этом процессе сыграло появление Интернета и, как следствие, доступ к большим массивам данных.

Яркий пример визуализации этой эпохи – визуализация сети Интернет, сделанная Opte Project: