Куприянова И.А. Проблемы фиксации опыта и Интернет – представление архивной информации.

18 января 2016 - Виктор Холев

Чтобы не создавать свалку –
управляйте содержанием
тех знаний, которые планируете
поместить в архив.

Предисловие автора
    Деятельность в сфере культуры безопасности привела меня к пониманию того, что следует обратить внимание на следующий аспект понятия «культура безопасности», который получил название «управление ядерными знаниями» [1]. Попав на работу в другую организацию, получила возможность сравнить этот аспект деятельности двух организаций, занимающихся, так или иначе, работой с использованием ядерных знаний. Опытом такой практической работы и хочу поделиться с коллегами.


Как это было
Так случилось, что пришлось разрабатывать электронный архив. Причем, не просто электронный архив, а такой, который должен был быть представлен в рамках межведомственного Интернет – портала. Для того, чтобы выбрать направление проектирования такого инструмента, надо было задать себе ряд вопросов, чтобы принять в дальнейшем достаточно много нестандартных решений. Первое из них должно ответить на вопрос – как назвать суть такой работы, чтобы она отражала ее цель?
Суть решено было сформулировать таким образом: «Проблемы фиксации опыта и Интернет – представление архивной информации».
Следующий вопрос вытекал уже из названия этой сути, и  я сформулировала его таким образом: «Как фиксировать опыт и представлять информацию, которая ограничена тематикой межведомственной системы, формой представления информации и тем содержанием и объемом информации, которые отличают бумажный и/или электронный архив организации от электронного архива, размещаемого через Интернет – представление?».
Размышляя далее над этими вопросами, ответила, прежде всего, на вопрос об объеме и, соответственно, о критериях, которые этот объем регулируют. Познакомившись с массивом информации, с которым предстояло работать, пришло понимание, что даже массивом называть этот ворох бумажных сведений некорректно. Информация была представлена в следующих формах:
- в мешках, набитых папками (иногда подписанными, а иногда без опознавательных знаков);
- в шкафах с папками и/или просто стопками бумаг на полках;
- в виде карт с данными авиасъемок территорий (свернутых или сложенных),  заваленных другими «бумагами»;
- в виде содержимого личных шкафов, столов и открытых сейфов, использующихся как стеллажи.
Что касается содержания этого массива (назовем все же его так), то не всегда удавалось опознать год, авторов, сами данные (зачеркнуты, выцвели и т.п.) документов, откуда информация и для кого она предназначена. По этой причине первый шаг к систематизации информации был такой: отобрать документы, которые имеют необходимые для идентификации атрибуты - как минимум: год, авторов, организацию (или ее опосредованно удается определить), принадлежность сведений и данных. После первого шага последовал второй шаг: определить тематические рубрики в целом (соответственно предметной области, к которой относится информация). Далее пришлось уделить время согласованию объема информации разрабатываемого архива. Ограничения оказались такими:
- Интернет – представление может быть только для «открытой информации», а это значит, что документы не должны иметь никакого ограничительного «грифа», и это должно быть подтверждено официально.
- Не все документы представляют интерес для предполагаемой целевой аудитории.
- Интернет – представление в рамках разработанного межведомственного портала может безболезненно «переварить» архив документов объемом около 280 – 300 единиц информации (за единицу информации мы приняли документ, включая его метаописание и сам оцифрованный впоследствии исходный документ).
Итак, пришло время ответить на вопрос: «А какова же целевая аудитория?». После обсуждения с экспертами ведомств не пришли к общему мнению и отложили его выработку «на потом».
После «неответа» на этот вопрос можно было вернуться к проблеме фиксации опыта, проще говоря – к проблеме систематизации информации. Тут опять понадобилось провести совещание экспертов предметной области для того, чтобы ответить на вопрос о критериях систематизации.
Довольно быстро было понято, что «гуглообразный» подход к организации  поиска нас не устраивает. Нужно было направить пользователя на интересующий его документ как можно раньше, не утомляя ненужными ему подробностями. Надо было «запустить» пользователя вглубь массива документов, отобрать документы в соответствии с тематикой, чтобы он увидел более «узкий» набор тематик и, соответственно, документов, которые его интересуют.
На этом этапе мы остановились, и я начала снова думать о целевой аудитории, которая предположительно будет у «Интернет – представленного» архива документов.

Для кого мы работаем или «поиск целевой аудитории»

Возвращаясь раз за разом к вопросу о целевой аудитории, пришлось признаться себе, что нередко она не сформирована по множеству разных причин, часть из которых представлена далее:
- если специалист не находится в стадии обучения, написания диссертационной работы или большой книги/монографии, то архивом как таковым он не интересуется (даже в своей предметной области);
- специалисты «рыскают» по Интернету, ища какую-нибудь псевдо-полезную информацию, не умея задавать вопросы поисковой системе;
- молодое поколение специалистов и будущих ученых нередко психологически не готово изучать то, что было сделано до них. Они стремятся изобретать «свое собственное колесо».
Оказывается, что легче было определить, кто не входит в целевую аудиторию. Так кто же в нее все-таки входит?
- специалисты, работающие в «узкой» предметной области, которые хотят или должны с ней познакомиться и обучиться;
- журналисты, которые будут (или уже пишут) писать о предметной области;
- ученые, которые работают над диссертационными задачами или статьями;
- руководители и менеджеры, которые должны по роду работы познакомиться с нормативной и фактографической базовой информацией предметной области;
- и те, кому предметная область по тем или иным причинам интересна.
Вплотную к этой проблеме встала проблема отбора документов для представления архива на Интернет – портале. Руководствуясь вышесказанным, было решено не включать в архив  «слепые тексты»; тексты, не связанные напрямую с тематикой (то есть, деловая переписка, организационные распоряжения и т.п.); промежуточные отчеты, если имеется заключительный отчет; рабочие журналы без опознавательных атрибутов.

Трудности
Подводя промежуточные итоги сказанному, сделаю следующий акцент на том, в чем состояли основные трудности создания вышеназванного инструмента. Оказалось, что трудности отнюдь не в методологии разработки электронных архивов документов, как предполагалось вначале, ибо на эту тему в сети (и не только) имеется множество публикаций.
Основная трудность состояла в том, что в современной культуре работы достаточно большого количества научных работников разного возраста нет практики изучения прошлого опыта и извлечения уроков из него. Работу часто начинают делать «как в первый раз», а для этого архивы не нужны. Если появляются вопросы, то обращаются к поисковым программам Интернета, которые при неумелом формировании запроса к ним выдают пользователю «миллион» ответов.
Следующая трудность, напрямую связанная с вышеназванной трудностью, заключается в том, что специалисты не умеют найти ту информацию, которая им нужна. Зато они сразу делают вывод о том, что такого никто до них не делал, либо, делают вывод о том, что найденная информация и есть - достоверная информация. Особенно это характерно для студентов, пишущих дипломную работу. К этому надо добавить чисто психологическую неготовность принять тот факт, что архив сам по себе может в чем-то быть полезен. Большинство относится даже к электронным архивам как «к свалке пыльных бумаг».
К сожалению, есть и еще одна причина, состоящая в том, что опытные сотрудники нередко считают, что в своей предметной области знают все, что необходимо знать, и, соответственно, архивы им ни к чему.
Итак, ситуация привела к заключению о том, что мы работаем в стране «невыученных уроков», потому что именно Интернет – представленные архивы помогают эти уроки выучить и, учась на ошибках, знакомясь  вновь с уже добытыми и затем забытыми знаниями, использовать и распространять их. Иначе знания не только не сохраняются, но даже и не передаются в нужном качестве. Без Интернет-представленных архивов предметных областей невероятно трудно разработать механизмы фиксации опыта.

Что из этого вышло или «принципиальные решения для систематизации информации»
Трудности, перечисленные выше, не помешали довести создание электронного Интернет - архива до состояния приемки в промышленную эксплуатацию. Мы их преодолели.
Поскольку управление содержанием занимается вопросами, связанными с систематизацией, организацией, поиском и получением информации пользователями, то были рассмотрены все шаги этого процесса [2].
На основе принятых решений удалось систематизировать информацию, довести объем единиц информации до 280, оцифровать документы и создать достаточно удобный интерфейс для разнообразной аудитории пользователей. Об этих решениях речь пойдет далее.

Решение 1. Двухуровневый подход.
Довольно быстро выяснилось, что собирать информацию в тематические рубрики лучше всего используя так называемый двухуровневый подход. Такое решение было принято из-за того, что эксперты предпочли (человеческий фактор!) сначала «привычное» деление документов по форме, принятой в российской практике – на отчеты, справки и т.п.
Для систематизации Интернет - представления архивной информации Интернет представленной информации были рассмотрены разные варианты декомпозиции.  Остановились на следующем:
1 уровень – разделение документов на категории по форме представления документа.
2 уровень – тематическая рубрикация на основе тематической принадлежности.
Поэтому первый уровень - это статус информации, который имеет стандартную форму:
отчета,
справки,
книги или монографии,
уникальной публикации (которая не входит в понятие «книга, монография»),
атласа,
журнала.
Следующий критерий систематизации был основан на периодах, в которые документы создавались и/или публиковались. Таким образом, каждая тематическая рубрика содержала ряд документов, помещенных в различные периоды. Затем был принят еще ряд принципиальных решений, которые требуют пояснений.
Решение 2. Метаописания
Размышления о целевой аудитории привели к тому, что созрело понимание необходимости разработать метаописание каждой единицы информации, то есть, каждого документа. Возможно, что не всем пользователям из названной разнообразной целевой аудитории необходимо знакомиться именно с исходным документом, а достаточно получить общую информацию о документе. Так появилась задача разработки метаописаний. Нередко наличие метаописания документа достаточно для пользователя, ели его цель - общее знакомство с тематикой. Тематика отражена в разделе «Реферат» метаописания, там же имеется раздел «Ключевые слова» и раздел «Авторы».
Метаописание это – совокупность дополнительных признаков, собранных в определенные форматы, позволяющие однозначно идентифицировать определяемый объект. В качестве объекта в контексте данной работы рассматривается документ. Элементом метаописания являются метаданные, которые указывают на значимые атрибуты документа.
Для каждого  уровня электронного архива предусмотрена форма, содержащая метаданные. Форма заканчивается гиперссылкой на документ, с которым можно познакомиться, пойдя по этой гиперсссылке.
Форма метаописания может быть реализована согласно следующему макету:


 

Решение 3. Ключевые слова
Для определения ключевых слов нередко используется технология частотного анализа на основе изучения массива документов, которые предполагается поместить в электронный архив на Интернет – портале.

Решение 4. Каталог документов

Каталог документов электронного архива состоит из двух больших частей:
- Нормативные документы, связанные с радиационными авариями
- Документы, связанные с радиационным мониторингом окружающей среды.
В эту вторую группу документов входит и раздел «Документы, связанные с радиационными авариями». Итак, пришло время назвать предметную область: «Архив исторической и научной информации, посвященный проблеме ликвидации последствий аварии на ЧАЭС».

Как это выглядит
    На экране после выбора каждого раздела появляется краткий текст, рассказывающий о содержании раздела:
В Каталоге документов содержится совокупность документов, относящихся к теме ликвидации последствий различных радиационных аварий. Целью включения в каталог представленных документов является информирование органов исполнительной власти и населения о реализации ФЦП по преодолению последствий радиационных аварий, а также обучение населения с помощью интернет – технологий.
Например, раздел «Документы по аварии на ЧАЭС» имеет меню:
Отчеты
Справки
Рабочие журналы
Уникальные публикации

Каждый выбор этого меню сопровождается поясняющим текстом. Например, выбрав раздел «Отчеты», пользователь увидит следующий текст:
Отчет - это документ, содержимое которого представляет информацию или отражает вопросы и исследования применительно к данной ситуации
В этот раздел помещены документы, собранные по трехлетним периодам, которые носят статус отчета и составлены по материалам измерений радиационных параметров внешней среды, проведенных различными организациями и ведомствами, в частности, институтом Биофизики Минздрава СССР, ЛВД ЧАЭС, ИЯИ АН УССР и частично другими организациями.
Отчеты касаются следующих областей знаний:
- Методики обследования и измерений.
- Общая радиационная характеристика 30 км зоны.
- Результаты исследования изотопного состава радиоактивных нуклидов в районе ЧАЭС.
- Таблицы с данными: изотопный состав гамма-излучающих нуклидов, содержащихся в различных пробах с ЧАЭС на определенные даты, начиная с дат, непосредственно после аварии.
- Загрязненность почвы и растительности.
- Загрязненность водного бассейна.
- Загрязненность воздушной среды.
- Загрязненность пищевых продуктов.
- Загрязненность отдельных пунктов 30 км зоны.
- Радиационная обстановка в г. Чернобыль.
К отчетам нередко прилагаются карты, таблицы с данными по отобранным пробам и другие таблицы, содержащие совокупные данные по радиационной обстановке.
Кроме того, к этому типу отнесены документы, отобранные экспертами как документы, предназначенные для верхних эшелонов власти - для министерств и ведомств, для правительства, которые принимали основные решения по ликвидации последствий аварии на ЧАЭС.
Документы носят уникальный характер, некоторые из них сохранились в единственном экземпляре.
Выбрав раздел «Справки», пользователь видит следующий текст:
К типу документов "Справки" экспертами отнесены такие документы, которые являются, по сути, ответами на запросы различных организаций. Изначально они носят такие названия: Таблицы, Информация, Сведения, Справки, Результаты и т.п.

Выбрав раздел «Рабочие журналы», пользователь видит следующий текст:
Рабочие журналы - документы, которые нередко велись в экспедиционных условиях. В них содержатся записи о месте и времени отбора проб (названия населенных пунктов и/или областей и районов, даты), используемое оборудование и способы отбора проб. Другой вид документов, отнесенный к категории "Рабочие журналы", это документы с данными об измерениях проб, отобранных сторонними организациями. Иными словами - это документы с расчетными данными (активность, плотность загрязнения и т.п.). Большей частью это - рукописные документы.
Выбрав раздел «Уникальные публикации», пользователь видит такой текст:
В раздел "уникальные публикации" помещены те документы, которые носили статус "брошюра", "препринт", а также публикации в некоторых узко - специализированных журналах. Эти документы определены экспертами как уникальные, и вынесено решение о целесообразности их включения в Каталог.

Затем документы систематизированы по периодам, а потом – по тематикам.


В  заключение хотелось бы сформулировать действия для фиксации опыта и дать рекомендации тем, кто пойдет  следом.
Для того, чтобы фиксировать опыт работы над определенным проектом категорически необходимо произвести следующие действия:
- описать предметную область;
- определить целевую аудиторию, которая будет пользоваться плодами вашего труда;
- описать те  дополнительные действия, которые пришлось исполнить для осуществления представления архивной информации в Интернете, то есть, для всеобщего пользования;
- перечислить те трудности, которые встретились во время выполнения проекта, и для преодоления которых пришлось принимать определенные  решения;
- полезно также перечислить те компромиссные решения, которые были приняты вместо «идеальных» решений.
Выполняя эту работу, не обойтись без доверия, то есть, ожидания того, как поведет себя какой-то другой сотрудник, знания которого нужны для  определенного направления работы. Над нашим проектом активно работало 7 человек, не все из которых имели навык командной работы. Поэтому обратите внимание на проблемы коммуникации. Это отдельная «песня», и руководителю проекта придется ее спеть!
Во время  опытной эксплуатации электронного Интернет – архива,  представленного на межведомственном Интернет – портале, велся Журнал событий, где  фиксировались пожелания,  впечатления, замечания пользователей.  Период опытной эксплуатации оказался довольно длинным – полтора года. Некоторые записи из Журнала событий представляю вашему вниманию:


По архиву документов. Мне кажется, что в перечне документов удобнее было бы поменять порядок их следования на обратный (упорядочить по дате). Так, чтобы более новые документы были наверху. Проще искать актуальную информацию.

С электронным архивом на межведомственном Интернет – портале (результатом проделанной работы) можно познакомиться:
http://rb.mchs.gov.ru/rosgidromet/Archive/Katalog_dokumentov

 

Использованные источники:
[1] – Куприянова И.А. Управление знаниями и организационная культура в практике эксплуатационного персонала объектов атомной энергетики. Журнал НВ (Наследие века), № 10 август 2015., стр. 22-23.
[2] Управление знаниями. Шаг за шагом. Мелисси Клеммонс Румизен. Москва, АСТ Астрель. 2004.

 

 

Комментарии (0)

Нет комментариев. Ваш будет первым!

Добавить комментарий