Работа с данными стала неотъемлимой частью множества научных дисциплин и является частью повседневной жизни для многих исследований за пределами информационных технологий: биологии, метеорологии, медицины, экономики, социологии, материаловедения и многих других. Одной из подобных дисциплин являются гуманитарные науки, где также применяются многочисленные инструменты работы с данными. Ряд этих инструментов хорошо известны, но многие, относящиеся к современному стеку данных (modern data stack), пока почти не применяются. В докладе я сделаю краткий обзор основных видов таких инструментов для задач сбора и обработки данных, расскажу о том что такое ETL/ELT, конвейеры данных, каталоги данных и чуть подробнее затрону некоторые из этих инструментов такие как: DuckDB и OpenRefine.
Бегтин Иван Викторович — создатель международного проекта поиска по данным Dateno и руководитель НКО «Инфокультура», специализирующееся на открытых данных (телеграм-канал, блог/рассылка, Национальный цифровой архив – https://ruarxive.org).
Ведущий семинара «Цифровая среда» DHRI@SFU — Андрей Юрьевич Володин (МГУ/СФУ).
Следить за новостями Института цифровых гуманитарных исследований (DHRI) удобно в телеграм-канале «Гуманитарии в цифре».
Иллюстрация получена по промпту «Дата-инженерия в цифровой гуманитаристике» у модели Kandinsky 3.1.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.