Коллекция «Журнал Демоскоп»

 

Источник: официальный сайт www.demoscope.ru

Префикс коллекции: demos

Обновления: раз в две недели по средам

 

Алгоритм обновления коллекции:

 

Шаг 1: Скачивание документов

 

  1. 1.Скачать документ с сайта с помощью программы “Winhttrack Website Copier”, которая находится в директории C:\\colls\demos\converter; 

  2. 2.Зайти на сайт-источник; 

  3. 3.Выбрать раздел «Архив» (рис. 1); 

 

 

Рис. 1: Главная страница сайта источника, выбор раздела «Архив»

 

  1. 4.В списках номеров по годам выбрать нужный (Рис. 2); 

 

 

Рис. 2: Выбор номера из архива на сайте источника

 

  1. 5.После автоматического открытия выбранного номера скопировать ссылку из строки адреса web-браузера, например, http://demoscope.ru/weekly/2015/0667/index.php; 

(Ссылка содержит в себе год и идентификатор номера): 2015, 0667

  1. 6.Запустить файл winhttrack.exe, нажать кнопку «Далее»; 

  2. 7.Ввести имя и категорию проекта – “Demoscope-0667”, указать Каталог C:\colls\demos\docs\input\0667 (номер 0667 в данном случае берется из URL скопированного на шаге 4 адреса (Рис. 3). Для каждой загрузки данное значение свое. Так же нужно создать такую папку, что бы она существовала до начала загрузки; 

 

 

Рис. 3: Ввод имени и категории проекта

 

  1. 8.Изменить в веб адресе(URL) номер документа, который нужно скачать, вставив скопированный на шаге 4 URL-адрес (Рис. 4); 

 

 

Рис. 4: Ввод URL-адреса для скачивания коллекции документов

 

  1. 9.Нажать «Задать параметры», перейди во вкладку «Лимиты», установить значение «Максимальная внешняя глубина» = 0, нажать ОК (Рис. 5); 

 

 

Рис. 5: Установка значения «Лимиты» в 0

 

  1. 10.Нажать «Далее» и «Готово» (Рис. 6); 

 

 

Рис. 6: Заключительный этап настройки процесса загрузки документов

 

  1. 11.Наслаждаться жизнью ожидая конца процедуры скачивания документов; 

  2. 12.Закрыть программу по завершению загрузки документов; 

 

Шаг 2: Конвертирование загруженных документов

 

  1. 1.Запустить конвертер converter.bat, который находится в директории C:\colls\demos\convert, и по запросу “Documents path” ввести номер журнала, который был указан в качестве названия папки и взят как и в п. 6 шага 1. В данном случае это 0667. После ввода номера нажать Enter. Дождаться, когда программа просканирует и обработает документы и выведет сообщение о завершении с предложением нажать любую клавишу; 

  2. 2.Обработанные пары HDR/HTM хранятся в директории C:\colls\demos\docs\input\0667\Demoscope-0667\demoscope.ru\weekly\2015\0667\LOAD (год и номер журнала в данном случаи варьируются в зависимости от загрузки); 

 

Шаг 3. Загрузка в систему

 

  1. 1.Выложить документы в папку с именем префикса коллекции; 

  2. 2.Удалить исходные файлы обработанных документов (бекап HDR/HTM будет автоматически сделан при загрузке документов); 

 

 

 

 

Коллекция «Международные договоры»

 

Префикс коллекции: md

Источник: официальный сайт НТЦ «Система» www1.systema.ru

Обновления: раз в месяц

 

Алгоритм обновления коллекции:

 

Шаг 1. Скачивание исходных документов

 

  1. 1.Отключить антивирус (будет мешать скачиванию архивов коллекции); 

  2. 2.Зайти на сайт источника коллекции и перейти в раздел «Порции пополнений»; 

 

 

Рис. 1: Главная страница источника

 

  1. 3. Войти в систему, использую логин nivc_mgu, пароль ncmgu ; 

 

 

Рис. 2: Вход в систему

 

  1. 4.Зайти по ссылке «Бюллетень международных договоров»;