Федеральная политехническая школа Лозанны, совместно с венецианским университетом Ка Фоскари и при финансовой поддержке Фонда Lombard Odier, запустила масштабный междисциплинарный проект Venice Time Machine. Его цель - позволить нам окунуться в тысячелетнюю историю и культурное наследие Венеции, буквально не выходя из дома. Благодаря современным технологиям книги, документы, карты и манускрипты, хранящиеся в восьмидесятикилометровых архивах города на воде, оцифровываются и складываются в виртуальную «машину времени». Сегодня историки со всего мира приезжают в жемчужину Адриатики, чтобы изучить ценные рукописи и карты. А что, если это богатство станет доступно любому пользователю компьютера? Можно ли сделать архив виртуальным? Под силу ли учёным создать Google Street View города XVII века, чтобы каждый урбанист смог найти на карте застройку древнего венецианского канала так же легко, как ближайший к дому магазин?
Создатель Venice Time Machine Фредерик Каплан (EPFL) на эти вопросы отвечает утвердительно. По его замыслу, интерактивная трёхмерная симуляция должна реконструировать прошлое Венеции, города, жители которого скрупулёзно сохранили все, даже самые на первый взгляд незначительные документы (от цены за килограмм рыбы в X веке до стоимости дворца в XVIII-м). Комбинируя тонны архивной документации, специалисты с максимальной точностью конструируют венецианское прошлое: биографии людей, политические настроения Италии и Европы, внешний вид отдельных зданий и целых кварталов, квитанции о заработной плате рабочих, описания будничных междоусобиц на торговых площадях и многое другое.
Как это работает? С технической точки зрения, перед Venice Time Machine немало сложных и интересных задач. Чтобы оцифровать и проанализировать большой объём данных, участники проекта оптимально организовали свой рабочий процесс, разделив его на несколько частей, в соответствии с методами и алгоритмами исследования. Группа итальянских учёных занимается сканированием документов на высокотехнологичных машинах, созданных в EPFL. Эти сканеры сильно отличаются от привычных нам: они позволяют обрабатывать более 1000 документов в час, а также сканировать книги, не переворачивая страницы. Далее рукописные тексты на редких языках, таких как латынь или староитальянский, необходимо транскрибировать. Это делается при помощи логического преобразования каждого слова в картинку. Затем ищется похожая картинка в других документах, слова распознаются, соединяются в предложения, и вот перед нами расшифрованный контракт итальянского рабочего, скажем, XIX века.
Разрозненные частички информации объединяются в гигантский граф, «вмещающий в себя» людей, места и события в тот или иной момент времени. Наши читатели знают, конечно, что граф – это математическое понятие, обозначающее объект, состоящий из вершин и соединяющих их рёбер. В данном же случае граф - это набор данных и связей между ними. То есть вершина графа может представлять собой, например, рабочего Венеции, а соединение ее с другими вершинами - тип связей между ним и окружающим миром: этот рабочий выступает как член семьи, как рабочий предприятия, как житель квартала и так далее. Таким образом, получается огромная концептуальная схема, где все-все данные соединены друг с другом по смыслу. Вершин, которые ни с чем не соединяются и никому не принадлежат, просто нет. . «Реконструировать прошлое – это как решать гигантское cудоку», - отметил Фредерик Каплан в интервью Цюрихской политехнической школе. Действительно, пустые точки на графе по мере продвижения проекта наполняются разнообразными данными, образуя новый слой информации о венецианской жизни. А всё, что требуется от нас, - это сделать запрос на интересующую тему и за считанные секунды получить нужную информацию.
Venice Time Machine уникальна в своей междисциплинарности. В этом проекте точные науки и информационные технологии оказываются на службе у историков, музееведов, археологов, социологов, географов и урбанистов. «Наша команда действительно очень разношёрстная. В ней есть студенты-магистры, докторанты-сотрудники по машинному обучению и распознаванию изображений, учёные в сфере Natural Language Processing, а также историки, географы и социологи», - рассказывает один из участников проекта. По его мнению, главное в Venice Time Machine – это сооружение инновационного инструмента, который в дальнейшем можно будет использовать для воссоздания истории всего человечества на основе архивов.