понедельник, 22 августа 2011 г.

census data

КАК ПРОИСХОДИТ ОБРАБОТКА ДАННЫХ ПЕРЕПИСИ?


Территориальный орган Росстата по Астраханской области, Территориальный орган Росстата по Астраханской области

В соответствии с Конституцией Российской Федерации, Федеральным законом от 25 января 2002 г. №8-ФЗ «О Всероссийской переписи населения», постановлением Правительства Российской Федерации от 23 декабря 2009 г. №1074 «Об организации Всероссийской переписи населения 2010 года», «Основными методологическими и организационными положениями Всероссийской переписи населения 2010 года», согласованными с Министерством экономического развития Российской Федерации и утвержденными приказом Росстата от 4 февраля 2010 г. №81, с 14 по 25 октября 2010 года проведена Всероссийская перепись населения.

Для основной массы населения перепись и закончилась этими десятью днями. Однако в территориальных органах статистики работа идёт по-прежнему. В чём же она заключается? Прежде всего, перепись – это не только опрос населения (который, собственно, и прошёл в октябре 2010 года), но и последующая систематизация заполненных документов, обработка полученных сведений.

Если говорить об Астраханской области, то 2538 портфелей с документами были доставлены со всех концов области в Астраханьстат, размещены на стеллажах, проведена опись массива, собранные материалы систематизированы. С декабря прошлого года к работе приступили кодировщики. Их задачей было подготовить материалы переписи к автоматизированной обработке: провести формальный и логический контроль заполнения переписных листов, комплектование материалов, подсчет итогов по портфелю, заполнение сопроводительной документации. С помощью форм Контрольного Списка лиц (КС), поступивших как с разных уголков нашей области, так и со всей страны, были выявлены граждане, учтённые дважды, исправлены ошибки, допущенные переписчиками, вручную просчитаны переписные листы всех форм и полностью подготовлены для сканирования. В конце марта кодировщики закончили свою работу.



С 11 января 2011 года по мере готовности переписных листов материалы переписи начали обрабатываться с помощью автоматизированной системы – АС ВПН 2010, разработанной на базе новейших технологических решений с учетом отечественного и зарубежного опыта. В АС ВПН-2010 предусмотрена интегрированная система обеспечения информационной безопасности и защиты от несанкционированного доступа на региональном и федеральном уровнях. Система полностью обеспечивает конфиденциальность первичных данных, полученных в ходе опроса населения. Автоматизированная обработка данных переписи населения проходит в два этапа. Сначала обработка переписных листов проводилась в региональных центрах обработки, теперь – в федеральном.

Переписные листы сканировались и производилось сохранение информации в виде электронных пачек на сервер. Для сканирования использовались быстродействующие отечественные сканеры для ввода, а также распознавания информации, записанной цифрами или графическими метками. Скорость сканирования – до 150 бланков в минуту.

При сканировании получают электронный вид переписного листа, а из этих файлов формируется обезличенная база данных. Электронный вид переписного листа используется для проведения сверки и дальнейших контролей информации. После завершения обработки Росстат передаст электронные образы переписных листов (с соответствующим программным обеспечением) в государственный архив для постоянного хранения. Правила хранения переписных листов и иных документов Всероссийской переписи населения 2010 года утверждены постановлением Правительства Российской Федерации.

Далее идет процесс экранного кодирования. Переписчик при опросе ставил в переписном листе метки (крестики), цифры, а по отдельным вопросам записывал ответы словами: названия субъектов Российской Федерации или стран мира, где опрашиваемые родились или откуда приехали в данный населенный пункт, национальную принадлежность и владение языками. На этапе экранного кодирования оператор производит кодирование информации на основе различных справочников и словарей. Это официальные классификаторы, например, перечень национальностей. На экран выводится этот перечень на определенную букву (каждая национальность имеет цифровой код), а также запись переписчика. Оператор видит запись переписчика, сам классификатор и присваивает записи соответствующий код, если она не была распознана автоматически.

Затем проводятся формальный и логический контроли информации переписных листов. Формальный контроль заключается в проверке переписного документа на наличие ответа по каждому вопросу, а также соответствие ответа допустимому диапазону значений, указанному в переписном листе. При логическом контроле оператор устраняет все «нелогические» ошибки переписчика. Например, если в переписных листах на детей заполнена информация о том, что они имеют высшее образование или ученые степени.

Обработка бланков, их сканирование, автокодирование и формально-логический контроль переписных листов продолжались до первой декады июня. В Астраханьстате экономисты, проводившие формально-логический контроль, закончили работу с документами даже несколько раньше. По мере готовности обработанные материалы отправлялись на DVD-носителях в Росстат. Оттуда проводился ежедневный мониторинг выполнения поставленных задач, соблюдения сроков и качества работы на всех этапах во всех территориальных органах Росстата. Всего за пять месяцев органами статистики по всей стране обработано почти 195 миллионов переписных листов различных форм – Л (заполнялись переписчиками на постоянных жителей страны), П (заполнялись на помещение), В (заполнялись на лиц, временно находившихся в стране).

На основе информации с этих DVD-носителей в ГМЦ Росстата (Главном межрегиональном центре обработки и распространения статистической информации) создадут сводную базу данных по всем субъектам Российской Федерации. И уже на основе данной базы будут сформированы итоговые таблицы для официального опубликования. До конца мая и сам ГМЦ Росстата выполнял функции регионального центра по Центральному федеральному округу. Здесь, также как и в других регионах, осуществлялась обработка информации переписных листов. А как центр федерального уровня, ГМЦ Росстата осуществляет «аккумулирование» всей введенной информации в субъектах РФ, формирование сводной базы данных по стране, из которой получают итоговые таблицы для официальной публикации. ГМЦ Росстата – это место, где можно увидеть весь процесс автоматизированной обработки и подведения итогов Всероссийской переписи населения 2010 года.

Подведение итогов, т.е. получение статистических таблиц, осуществляется на основании Программы итогов Всероссийской переписи населения 2010 года, утвержденной приказом Росстата от 04.03.2010 г. № 113. Таблицы Программы итогов Всероссийской переписи населения 2010 года сгруппированы по 10 тематическим разделам. В зависимости от сложности алгоритмов и временных затрат таблицы формируются в две очереди. В первую очередь будут получены таблицы, которые потребуют наименьшего времени для формирования, во вторую очередь разрабатываются остальные, более сложные и трудоемкие таблицы. Финальные сроки получения рабочих таблиц: I очередь – июнь 2012 г.; II очередь – декабрь 2012 г.

Правительством Российской Федерации сформирована Рабочая группа по официальному опубликованию итогов Всероссийской переписи населения 2010 года. Возглавляет ее Министр экономического развития Э.С. Набиуллина.

Итоги Всероссийской переписи населения 2010 года Росстат будет распространять в виде своих официальных печатных изданий и изданий на электронных носителях (11 тематических томов), популярных изданий для широкого круга пользователей (брошюры, атлас, пресс-релизы, презентационные материалы), а также разместит на официальном сайте www.gks.ru и сайтах территориальных органов Росстата (сайт Астараханьстата - astrastat.gks.ru). Впервые в отечественной практике на сайте Росстата будет обеспечен WEB-доступ пользователей к неперсонифицированной информации переписи с соблюдением условий конфиденциальности.

Как известно, предварительные итоги ВПН-2010 уже были озвучены. Пока они касаются лишь численности (с разбивкой на городское и сельское) и полового состава населения России. Окончательные итоги будут публиковаться по мере их обработки. Впервые информация сформируется в разрезе муниципальных образований. А пока, если мы действительно хотим точности и интересуемся настоящим положением дел, остаётся только ждать. Впрочем, осталось не так уж долго.

Комментариев нет:

Отправить комментарий