02.04 2012

Wikipedia обзавелась единым хранилищем информации

Автор: Канафоцький Андрей | Категории: Новости интернета

Wikipedia обзавелась единым хранилищем информацииСамый популярный во всемирной паутине справочно-познавательный сервис Wikipedia сегодня работает на 280 языках народов мира. Это неизбежно делит всю массу информации энциклопедии на отдельные составляющие, поэтому неудивительно, что у Wikipedia до сих пор не было основного «склада», где была бы собрана единая база данных для всего проекта. Ситуацию изменили сотрудники немецкого подразделения фонда Wikimedia Foundation, разработавшие проект Wikidata.

Wikidata представляет собой общее хранилище структурированной информации, которую можно использовать в работе различных версий Wikimedia. Разработчики планируют, что уже в декабре нынешнего года редакторы интернет-энциклопедии на разных языках смогут дополнять свои издания готовыми данными, не переписывая их вручную. На создание проекта ушло около 1,7 млн. долларов. Половину суммы предоставил Пол Аллен, сооснователь Microsoft. Четверть бюджета обеспечила корпорация Google. Оставшуюся часть денег добавил стоявший у истоков Intel Гордон Мур через свой фонд Gordon and Betty Moore Foundation.

Автор The Wikipedia Revolution Эндрю Ли рассказывает, что Wikidata логически развивает проект энциклопедии. Технологии, полученные в рамках разработки, будут доступны через Wikimedia Commons. Эндрю Ли считает, что Wikidata не только упрощает ежедневную работу модераторов сетевого справочника, но и снижает нагрузки на серверы, нормализует трафик и уменьшает общие расходы. Но Wikidata, предупреждает Ли, прежде всего рабочий инструмент, требующий от редакторов достаточной практической подготовки, что может вызвать на первых порах определённые трудности.

Проект только начал своё развитие, работа над ним в полном разгаре. Инженерам ещё предстоит найти решение, как структурировать ранее написанные статьи в энциклопедии, если они сохраняются только в виде текстовых файлов. Сегодня эту информацию приходится перерабатывать вручную. Пока решение не созрело, в проект придётся набрать достаточное количество работников, способных оптимизировать накопленные данные.

По материалам CyberSecurity.ru