• Рекомендации специализированной группы POSC "Хранение данных"

На главную страницу На главную страницу

Оглавление

  • Вводная часть
  • Понятия и терминология
  • Рекомендации
    • Раздел 1. Каталогизация E&P (в отрасли разведочных работ и производства)
    • Раздел 2. Справочные данные E&P
    • Раздел 3. Публикация результатов E&P
    • Раздел 4. Обмен между компаниями E&P
    • Раздел 5. Общие средства просмотра данных E&P
  • Заключение
  • Приложения
    • Рабочие группы корпорации POSC
    • Рабочая группа POSC по технологиям хранения данных
    • Глоссарий
    • Термины и понятия в каталогизации E&P
    • Ссылки на использованные документы
    • Участники специализированной группы "Хранение данных"

Вводная часть

Содержащиеся в настоящем документе рекомендации подготовлены специализированной группой корпорации POSC, состоящей из заинтересованных организаций индустрии E&P, в том числе операторов, провайдеров программных продуктов и услуг, государственных учреждений, консультирующих компаний и корпорации POSC. Цель рекомендаций СГ - обобщение практического опыта в накоплении, передаче и хранении данных, информации и знаний в интересах индустрии E&P. Автор этого документа, специализированная группа POSC, официально называется специализированной группой "Хранение данных". Данная СГ, по сути, является сообществом производителей и потребителей программных продуктов и услуг по хранению данных.
В документе представлен предварительный набор рекомендаций СГ, основанных на результатах работы в течение второго полугодия 2002 года. Цель СГ - стимулировать рассмотрение данных рекомендаций и положить их в основу практической деятельности. В течение 2003 года СГ предполагает опубликовать и внедрять эти рекомендации, одновременно разрабатывая и публикуя новые рекомендации для рассмотрения в отрасли.
Областью применения данных рекомендаций является общая каталогизация цифровых данных и документов E&P, эталонных значений, публикаций результатов проектов, информационный обмен между организациями и обеспечение возможности просмотра данных, в том числе в графическом виде.
Всех читателей просим присылать свои отзывы и пожелания, касающиеся затрагиваемых в этом документе вопросов. Свои отзывы просим направлять по адресу:
корпорация POSC, специализированная группа "Хранение данных", 9801 Westheimer Road, Suite 450, Houston, Texas 77042-3950 USA. Для Алана Донигера,
тел. +1 713 267 5124,
факс +1 713 784 9219,
E-mail: Doniger@POSC.org.

Понятия и терминология

В данном разделе изложены фундаментальные понятия и терминология, которые рассматриваются как основа работы СГ "Хранение данных".
  1. Общеупотребительные описательные имена типов хранилищ данных, которые могут заПЕТРОСЕРВИСтвоваться из названий коммерческих продуктов и в ряде случаев не передают полного точного значения функциональных возможностей или ограничений хранилищ данных (Data Stores).
  2. С учетом объединения понятий "знания", "информация" и "данные" (Knowledge-Information-Data) (См. Тему 1 ниже) термин "хранилище данных" (Data Store) правильнее было бы определить как "информационное хранилище" (Information Store) или "хранилище З-И-Д" (K-I-D Store). Тем не менее, сложившаяся практика позволяет оставить знакомое наименование "хранилище данных" (Data Store) для обозначения процессов управления и хранения единиц континуума знаний-информации-данных (Knowledge-Information-Data Continuum).
  3. Наиболее существенным различием между типами хранилищ данных является различие между хранилищами, непосредственно и активно участвующих в производственных процессах (активные хранилища данных) (Active-Use Data Stores) и хранилищами, предназначенными в основном для долговременной обработки и хранения единиц З-И-Д (информации) - долговременные хранилища данных (Long-Term Data Stores).
  4. Активные хранилища(Active-Use Data Stores) данных также называют оперативными или проектными хранилищами данных (Operational and Project Data Stores). Обычно оперативные хранилища данных обеспечивают повседневную, текущую, оперативную производственную деятельность, а проектные хранилища данных - специальные краткосрочные аналитические исследования для принятия важных деловых решений.
  5. 5. Долговременные хранилища данных (Long-Term Data Stores) также известны под названиями центральные (Master), корпоративные(Corporate) и хранилища (Warehouse) и как варианты, - результаты и активы (Results and Asset). Центральные хранилища данных (Master Data Store), как правило, содержат добываемые и/или получаемые в результате первичных измерений единицы информации. В последнее время в центральные хранилища данных (Master Data Store) информация поступает от многих организаций, доступ к этим хранилищам определяется соответствующими процедурами. Корпоративные хранилища данных (результаты или активы) (Corporate Data Store) обычно содержат результаты, полученные в результате деятельности, которую поддерживают активные хранилища данных (Active-Use Data Stores). Зачастую эти результаты ограничиваются объемом данных, которые считаются наиболее важными и качественными. Хранилища данных (Warehouse Data Stores) обычно содержат информацию, получаемую из активных хранилищ данных, и проектируются в основном для выполнения несложных заранее установленных запросов. Во многих случаях хранилища данных (Warehouse Data Stores) имеют дело с коммерческой и деловой информацией.

Рекомендации

Тема 1. Каталогизация E&P
Лучший метод организации работ 1. Каталог и словарь E&P

В отрасли необходимо использование общего стандартного, высокоуровневого определения каталога и связанного с ним словарного набора для заполнения атрибутов каталога, т.е. имеющихся атрибутов для внесения в каждую статью каталога, таких как "наименование", "описание" и "автор" (См. Проект спецификаций каталога V0.1 E&P).
Такие вопросы, как уровень согласованности словарей, учет региональных и местных различий, возможность установления соответствия с ранее созданными словарями и т.п., должны быть рассмотрены дополнительно.
Рекомендация нефтяным компаниям:

Ввести в практику понятия каталога. Проконсультироваться с организациями, которые уже сделали это, по вопросам о способах внедрения этих понятий, полученных преимуществах, обоснованиях и т.п. Направить свои отзывы по проведенным семинарам в корпорацию POSC для их учета в ходе разработки спецификаций области каталогизации. Активно и последовательно внедрять методы каталогизации в деятельность компании, добиваясь их эффективного использования.

Рекомендация поставщикам:

Поддержать понятия каталога в планах поставок будущих продуктов и услуг. Провести консультации с настоящими и потенциальными клиентами о путях выполнения этого требования. Направить свои отзывы по проведенным занятиям в корпорацию POSC для их учета в ходе разработки спецификаций области каталогизации.

Рекомендация для POSC:

Начать периодические публикации спецификаций каталогизации примерно раз в полгода в течение следующих двух лет. Объявить план выпуска и обсуждения каждой из публикаций с целью получения на них своевременных отзывов. Осуществлять контроль и поддерживать применение спецификаций. Установить и следить за критериями успеха и системы оценки. Например, краткосрочный успех определять количеством внедрений и поступивших отзывов, а долгосрочный - степенью конструктивного внедрения и ростом стабильности спецификаций.

Дополнительная рекомендация 1.1. Знания-информация-данные являются континуумом

Понятия "знания", "информация" и "данные" должны восприниматься в отрасли как континуум. В целом, единицы с интеллектуальным содержанием представляют собой скорее смесь знаний, информации и данных, чем что-либо одно в чистом виде.
Кроме того, единицы с интеллектуальным содержанием могут рассматриваться с одной стороны как данные, с другой - как информация, и как знания - с третьей. Например, трехмерная модель Земли может рассматриваться геологом как информация, а инженером-буровиком - как данные.
Хотя точные определения и точные границы с трудом поддаются выражению, сущность континуума представлена в определениях, которые были опубликованы в письме Кена Дейвенпорта (региональная библиотечная система северо-восточной Айовы, Библиотечный журнал, май 2002 г., том 127, номер 8, стр. 10):
  • Данные = наблюдения и измерения
  • Информация = данные плюс значимость и назначение (составные и в контексте)
  • Знания = информация плюс практическое назначение и использование (связанное с определенной деятельностью)
Сокращенное использование термина "информация" допустимо для обозначения всех трех понятий, за исключением случаев, когда термин "З-И-Д" (Knowledge-Information-Data) может использоваться для более точного определения. Например, единица информации (Information Item) воспринимается как интеллектуальная единица, содержащая знания, информацию и/или данные. Таким же образом термины "хранилище данных" (Data Store) и "хранилище информации" (Information Store) по сути своей взаимозаменяемы, и не предполагают каких-либо ограничений в характере содержания.

Дополнительная рекомендация 1.2. Единый контекст информационной единицы

В отрасли все документы и результаты запросов из хранилищ данных (иногда считающиеся динамическими документами) должны трактоваться единообразно как единицы информации, с позиций классификации, каталогизации и, следовательно, нахождения и доступа к ним.
Программные продукты системы обработки электронных документов (EDMS) обычно характеризуются свойствами управления, идентификации и целостности документа информации. Хранилища данных не имеют таких характеристик. Они функционируют в соответствии с моделями данных для заложенных в них единиц хранения, напр., таблицами, сущностями и объектами/классами, связями (внешние ключи и взаимосвязи), а также с правилами изменения данных. В результате запросов получаются документы, которые могут рассматриваться и трактоваться как документы, связанные с их источником в хранилище данных. Эти документы могут называться "динамическими документами" (Dynamic Documents) или "динамическими единицами информации" (Dynamic Information Items). Каталожные статьи могут формулироваться под запросы, представляющие собой шаблоны для потенциальных динамических единиц информации.
Дополнительная рекомендация 1.3. Каталожные записи и содержание

Определение, обработка и использование каталожных статей должны производиться в отрасли отдельно от каталогизируемых единиц информации. Это подразумевает, что единицы информации не должны изменяться, включая в себя соответствующие каталожные статьи или подстраиваясь под них.
Вновь созданные единицы информации, тем не менее, должны содержать номинальный набор атрибутов содержания, который мог бы использоваться для формулирования соответствующей каталожной статьи. Это можно сравнить с размещением подобной информации в книжных изданиях на обороте титульного листа. Такой метод позволяет упростить и повысить качество каталожных статей, создаваемых для единицы информации.
Дополнительная рекомендация 1.4. Ключевые атрибуты каталога

В отрасли должны быть определены и приняты к руководству стандарты справочных значений или порядок определения значений для атрибутов каталога.
Стандарты справочных значений представляют собой перечень определенных альтернативных значений, допущенных к использованию для данного атрибута каталога. Например, стандарт справочного значения для атрибута "статус издания" единицы информации может составлять набор значений, таких как "в работе", "черновик" или "завершена".
Руководящие стандарты определения значений - это описание методов и принципов, которые должны применяться при формулировании значения данного атрибута каталога. Например, руководящий стандарт для определения значения атрибута "производящий рабочий процесс" может выглядеть следующим образом: "определить наиболее характерный рабочий процесс, который определяет создание единицы информации".
Ключевые атрибуты каталога для единиц информации, в отношении которых должны применяться правила определения значений, включают: наименование, имя автора и организация, дата публикации, название проекта, географический район и степень защиты (вид доступа).
Ключевые атрибуты каталога для единиц информации, в отношении которых должны применяться стандарты наборов значений, включают: тип активов, вид информации, состояние качества, охват территории.
Тема 2. Справочные данные E&P
Лучший метод организации работ 2. Стандарты наборов справочных значений

В отрасли должны внедряться и применяться стандарты наборов справочных значений.
В первую очередь необходимо предусмотреть наборы справочных значений для следующих элементов данных E&P: картография (геодезические данные, преобразование координат, проекция); валюта; геополитическая характеристика страны, штат или провинция, графство или район; единицы измерения; диаграммы геофизических исследований скважин, каротажные кривые.
Стандарты наборов эталонных значений должны оставаться постоянными во времени, за исключением случаев необходимых изменений в основных методах работы отрасли, изменений, вызванных геополитическими реалиями и т.п., одобренных POSC. Такие изменения должны вводиться с указанием даты начала и/или окончания действия каждого отдельного изменения.
Рекомендации нефтяным компаниям:

Уточнить и внедрять стандартные списки справочных значений в средствах хранения данных, получаемых от поставщиков и разрабатываемых внутри компаний. Отделить и постепенно исключать нестандартные справочные значения из использования вообще, или через указание использования других значений. Представлять заявки в POSC на расширение или дополнительные изменения в справочных значениях.

Рекомендации поставщикам:

Уточнить и внедрять стандартные наборы справочных значений в технологиях хранения данных, предоставляемых как продукты или услуги. Обеспечить пользователям средства для отделения и последовательного изъятия нестандартных справочных значений из использования напрямую или через соответствия. Представлять заявки в POSC на расширение или дополнительные изменения в эталонных значениях.

Рекомендации для POSC:

Изучить состояние приведенных выше стандартов наборов справочных значений. Широко опубликовать эти стандарты и обеспечить к ним общий доступ. Обеспечить процесс оперативной поддержки стандартов в соответствии с поступающими запросами на их расширение или изменение.

Тема 3. Публикация результатов E&P
Лучший метод организации работ 3. Публикация результатов E&P

В отрасли должны быть определены, внедрены и приняты руководства для публикации результатов аналитических проектов и текущей оперативной работы. Публикация этих результатов зачастую требует переноса единиц информации из среды активного хранилища данных в среду долгосрочного хранилища данных и возможного ее объединения, фильтрования, адаптации и других операций.
Данные руководства должны касаться сроков, области действия, контроля качества, контроля версии и аспектов сохранения результатов публикаций.
Должно быть оговорено создание каталожных статей в ходе публикаций. Должно быть определено предполагаемое использование в будущем публикуемой информации любого рода, например, в связи с возможностью принятия в будущем каких-либо решений.
Должна быть оговорена разработка руководств для создания пакетов окончательных отчетов с минимальным содержанием, связанных с различными аспектами публикаций.
По истечении времени результаты проектных работ зачастую становятся все менее и менее пригодными для повторного использования. Эту тенденцию необходимо изучить и уточнить. Необходимо также выработать критерии, которые будут лежать в основе корректировки и сохранении публикаций результатов.
Необходима разработка и использование критериев и правил для заключительных интерпретаций и других рабочих проектов, связанных со знаниями.
Рекомендации нефтяным компаниям:

Осуществлять по возможности обмен с POSC правилами и положительным опытом работ по публикациям с целью выработки в масштабах отрасли правил и, возможно, стандартов для обеспечения качества и взаимодействия. Рабочая группа будет использовать такую информацию для последующего усовершенствования и расширения рекомендаций по тематике публикаций.

Рекомендации поставщикам:

Осуществлять по возможности обмен с POSC предложенными руководствами и методами, связанными с публикациями, с целью их использования в разработке в масштабах отрасли и, возможно, стандартов для обеспечения качества и согласованности. Специализированная группа будет использовать такую информацию для последующего усовершенствования и расширения этой рекомендации.

Рекомендации для POSC:

Оценивать информацию, поступающую от промышленных организаций, составлять руководства, которые будут рассматриваться СГ как промышленные стандарты, и использоваться для уточнения данной рекомендации в будущем.

Дополнительная рекомендация 3.1. Обеспечение каталогизации и хранения "бумажных" документов

Отрасль должна стремиться добывать, хранить и создавать номинальные каталожные статьи цифровых файловых копий документов, которые были созданы в оригинале на твердых носителях.
Такая практика поможет снизить необходимость сканирования документов с твердых носителей для создания цифровых копий для хранения, дублирования или архивирования. Это также обеспечит создание полных и точных каталожных статей, готовых к использованию во время публикации результатов.
Тема 4. Обмен между компаниями E&P
Лучший метод организации работ 4. Руководство по стандартам обмена между компаниями E&P

В отрасли должно поддерживаться создание аннотированного руководства по стандартам информационного обмена между компаниями, а также правил и методов такого обмена. Понятие "обмен между компаниями" включает также обмен между практически независимыми организациями, в том числе между операторами и партнерами, обслуживающими компаниями и операторами, операторами и органами государственного регулирования, и т.д. Стандарты, указанные в руководстве, должны иметь аннотации и использоваться в определенных условиях.
Это обеспечит осведомленность организаций об имеющихся возможностях и получение ими выгоды от наличия большого количества стандартов, правил и технологий.
Аннотации должны включать область применения, основанные на практическом опыте, комментарии пользователей, ограничения и т.п.
Рекомендации нефтяным компаниям:

В допустимых пределах осуществлять обмен информацией с POSC о технологиях передачи. Периодически производить сверку руководства с практической деятельностью компании и направлять свои пожелания и рекомендации в POSC. Специализированная группа будет использовать эту информацию для последующего усовершенствования и расширения тематики данной рекомендации с целью определения необходимости формирования стандартов высокоуровневой передачи данных, а также стандартов высокоуровневой передачи данных с технологиями перекрытия и т.п.

Рекомендации поставщикам:

В допустимых пределах осуществлять обмен информацией с POSC о методах передачи. Рабочая группа будет использовать эту информацию для последующего усовершенствования и расширения тематики данной рекомендации.

Рекомендации для POSC:

Собирать данные, поступающие от организаций отрасли и разработать указанное руководство. Периодически обновлять руководство путем внесения дополнений, изменений, удалений, и аннотаций. Предоставлять СГ аналитическую информацию о наличии пробелов, накладок или несоответствий, которые дают почву для выработки новых рекомендаций и практических мер как по новым отраслевым стандартам, так и по новым технологиям передачи данных.

Тема 5. Общие средства просмотра данных E&P
Лучший метод организации работ 5. Общие средства просмотра данных (вьюеры) E&P В отрасли должно поддерживаться определение, внедрение и использование минимального числа стандартов передачи для типов данных, которые могут отображаться с помощью общих средств просмотра, вьюеров типа "plug-in", разработанных для популярных браузерных программ в системе Интернет.
К типам данных, просматриваемым таким образом, относятся: каротажные диаграммы (сбор и обработка данных во время бурения и геофизических данных), конструкция скважин, графики добычи, производительность и т.п.
Рекомендации нефтяным компаниям:

Предоставить корпорации POSC информацию по первоочередным типам данных, которые целесообразно предварительно просматривать из многочисленных источников посредством общих вьюеров, и визуальному контролю качества. Рассмотреть возможность объединения усилий при разработки стартовых вьюеров со ссылками для просмотра определенных типов данных с целью создания регулируемых, открытых программных средств.

Рекомендации поставщикам:

Предоставить POSC информацию по ограничивающим условиям предварительного просмотра данных с использованием общих вьюеров через стандартные средства передачи из различных источников, напр., по объему данных, несоответствующей структуре данных и т.п. Рассмотреть вопрос о возможности генерирования выходных данных из источников данных своих программных продуктов и сервисных систем в соответствии со стандартными спецификациями передачи данных, определенными POSC для этой цели.

Рекомендации для POSC:

Определить существующие или разработать новые стандарты передачи для высокоуровневых типов данных, указанных в этом документе, или которые будут указаны нефтяными компаниями позже, для обеспечения возможности их просмотра с использованием общих вьюеров. В этих целях объединять под своим началом мероприятия по разработке стартовых вьюеров со ссылками и осуществлять поддержку некоторых вьюеров на уровне открытых кодов программ. Рассмотреть вопрос об использовании или по возможности адаптации существующих стандартов.

Заключение

Члены корпорации POSC и ее персонал выносят благодарность участникам специализированной группы "Хранение данных" за их работу и вклад в дело отрасли. Настоящие рекомендации - результат работы СГ в течение первых шести месяцев (июль - декабрь 2002 г.).
Поскольку данная работа группы является первой попыткой в своем роде, многие из этих рекомендаций носят высокоуровневый и исследовательский характер и требуют дальнейшей входящей информации и обратной связи для того, чтобы дать более определенные советы. Такие темы, как каталогизация, эталонные данные и публикация результатов достаточно обширны и важны и требуют проведения дальнейшего анализа СГ.
Действительной целью СГ корпорации POSC является стимулирование диалога в масштабах всей отрасли для совместного выявления тех направлений сотрудничества, которые будут способствовать повышению эффективности работы отрасли. В конечном результате рекомендации должны расширить рынки продуктов и услуг и способствовать снижению рынка, цен и время цикла для операторов. СГ POSC имеет уникальную возможность вносить предложения, изучать их, учитывая различные точки зрения и оперативно определять наиболее перспективные направления сотрудничества.
Уровень участия в СГ в течение шестимесячной работы был очень позитивным. Мы надеемся, что полное выполнение данных рекомендаций нефтяными компаниями, поставщиками и корпорацией POSC, будет осуществляться по нарастающей, в течение нескольких следующих периодов. В этот период СГ будет наблюдать за внедрением этих и последующих рекомендаций, направленных на повышение эффективности всей отрасли в целом.
Просим направлять свои мнения и предложения по представленному пакету рекомендаций в адрес корпорации POSC или любого из участников СГ "Хранение данных", где также можно получить дополнительную информацию.

Приложения

Специализированные группы POSC

В течение 2002 года корпорация POSC приступила к созданию специализированных групп (СГ) с целью объединения представителей групп организаций со сходными интересами в определенных областях. Каждая из специализированных групп функционирует на некоммерческой объединенной основе с целью определения передовых методов в практической работе отрасли, отраслевых стандартов и поддерживающих коммерческих продуктов и услуг. Корпорация POSC будет всячески поддерживать каждую из СГ с тем, чтобы все согласованные методы и рекомендации были реализованы, опубликованы и внедрены с обычной периодичностью в шесть месяцев, в первой и во второй половине каждого года.
Участие в работе СГ открыто как для членов POSC, так и для организаций, не входящих в состав корпорации. Поддержка СГ корпорацией обеспечивается взносами. Все участники выплачивают основные взносы каждые шесть месяцев. Участвующие организации, не являющиеся членами POSC, также выплачивают вспомогательные взносы. Взносы начисляются в виде процентов от ежегодных членских взносов организаций, входящих в состав POSC, которые зависят от типа и годового дохода организации. Например, основной взнос для СГ "Хранение данных" на период с января до июня 2003 года составляет 7,5% от членских взносов каждой из организаций POSC.
Преимущества участия в СГ сказываются на результатах работы каждой из организаций благодаря обучению и/или непосредственному влиянию на развитие сотрудничества в отрасли. Участники могут вносить предложения и усовершенствовать рекомендации по методам работы отрасли, поставляемым продуктам и услугам, а также по разработке и внедрению отраслевых стандартов. Группа обеспечивает уникальные условия, в которых нефтяные компании, поставщики и государственные органы вырабатывают общее понимание возможностей для делового взаимовыгодного сотрудничества в отрасли, а затем осуществляет контроль за выполнением принятых решений и обеспечивает в этом поддержку.
Характеристика СГ и порядок вступления содержатся на Web-сайте POSC http//www.posc.org/sig. Вступающие организации подписывают генеральное соглашение о вступлении в СГ корпорации POSC, в котором содержатся основные условия, в том числе открытость и положения об интеллектуальной собственности. Специфические условия, касающиеся временных периодов, целей и задач, а также взносов для каждой конкретной группы, оговариваются в отдельно подписываемых приложениях. Действие генерального соглашения и приложений рассчитано на продолжительный срок, например, на два года. Это должно снизить необходимость частого пересмотра и повторного утверждения этих документов. Участие в работе каждой из групп можно восстановить на 6-месячной основе.

Специализированная группа POSC "Хранение данных"

Создание СГ "Хранение данных" было предложено на собрании членов корпорации POSC в мае 2002 года. В июле группа была сформирована. Основной задачей группы является разработка рекомендаций по передовым методам работы отрасли, связанным с использованием программных продуктов и услуг по хранению данных. Участники группы проводили индивидуальные встречи с представителями POSC в течение сентября. Эти встречи позволили участникам обсудить основные понятия и первоначальные направления работы.
После этого были проведены рабочие совещания СГ в Лондоне в октябре, в Хьюстоне в ноябре и в Ставангере в декабре. Настоящие рекомендации - основной документ группы, разработанный в период июль - декабрь 2002 года.
План работы СГна период январь - июнь 2003 года: а) оценка отзывов от членов POSC и других организаций отрасли о предварительных рекомендациях, б) отслеживание и поощрение действий по внедрению рекомендаций, в) расширение и/или усовершенствование рекомендаций с целью их публикации в середине 2003 года и г) разработка дополнительных рекомендаций в других смежных областях в соответствии с требованиями участников Группы.
Создание Группы отвечает многочисленным пожеланиям членов POSC, высказываемым в течение последних лет, об уделении большего внимания вопросам управления данными. Среди причин создания коммерчески нейтральной группы по разработке методов обработки и передачи данных можно выделить следующие:
  • продолжающееся увеличение объемов информационного обмена между системами и организациями;
  • сокращение в отрасли числа специалистов, которые знают, где хранится информация, каково ее содержание и значение для последующего использования;
  • наличие в использовании достаточно совершенных продуктов для хранения проектных данных, дающих отрасли возможность определить те различия между ними, которые могут быть устранены;
  • текущие разработки новых продуктов хранения корпоративных данных, предоставляющих для отрасли возможность определить их необходимые общие возможности и характеристики;
  • развитие сторонних служб по обработке и хранению данных, альтернативных аналогичным внутриотраслевым службам.
Практика показала, что повышение слаженности и прозрачности, несомненно, помогают в работе, и что достижение этих целей требует согласованных усилий.

Область деятельности СГ

Основной темой дискуссий явилось определение и описание функциональных характеристик различных типов хранилищ данных. В начале был рассмотрен целый ряд наименований, присвоенных хранилищам данных. Основной целью было определение функциональных основных особенностей и ограничений. Результаты этих дискуссий отражены в разделе "Понятия и терминология" настоящего документа и в "Глоссарии".

Тематика рекомендаций СГ

Кроме обсуждения концептуальных понятий хранилищ данных и их функциональных особенностей, участникам было предложено внести вопросы, касающиеся существующих проблем и путей их решения. Эти вопросы были собраны в ходе индивидуальных предварительных встреч и затем рассмотрены, отредактированы и систематизированы в соответствии с их значимостью и выполнимостью в ходе рабочих совещаний. Наиболее важные и потенциально ценные вопросы обобщены в разделах рекомендаций, явившихся главной частью настоящего документа.
Независимо от создания группы, корпорация POSC получила просьбу поддержать дальнейшую разработку спецификаций для единого каталога информационных единиц отрасли E&P на основе наработок британской компании Shell Expro. Между POSC и СГ "Хранение данных" было достигнуто соглашение о том, что вопросы каталогизации должны рассматриваться с точки зрения требований и рекомендаций СГ. См. разделы "Каталогизация E&P", "Понятия и терминология", "Глоссарий" и др.

Основные правила Группы

В ходе совместной работы, например в СГ "Хранение данных", часто забывается, что ее участники являются представителями конкурирующих нефтяных компаний, поставщиков и пар "клиентов-поставщиков". Неоднократно доказывалось, что в определенных областях сотрудничество действительно может способствовать снижению стоимостных структур отрасли без существенного влияния на коммерческие возможности отдельных участников. Однако эта формула оправдывается не во всех случаях.
Общей задачей специализированных групп и СГ "Хранение данных" является определение направлений, повышение четкости и последовательности в которых может способствовать повышению качества и производительности во всей отрасли в целом, не оказывая существенного и негативного влияния на коммерческие интересы ее участников. Все участники СГ знают, что нужно четко определить границы сотрудничества, приемлемые для всех. Эти границы не всегда очевидны, и не всегда видятся одинаково различными организациями. Группа может внести свой вклад уже хотя бы тем, что ясно укажет эти приемлемые границы сотрудничества.
Другие основные правила касаются эффективного диалога, равного доступа к результатам консенсуса, эффективного использования ресурсов и времени, привлечения квалифицированных экспертов и необходимости оставить другим составление спецификаций и разработку сопутствующих программных средств. Составление спецификаций отраслевых стандартов внутри POSC, например, будет осуществляться штатными группами по спецификациям. Соответствующее программное обеспечение, при необходимости, лучше всего разрабатывать с помощью организующихся на небольшой срок специализированных бригад, действующих на основе контракта с разделением затрат и ресурсов.

Глоссарий

Хранилище данных (Data Store)
Средство, предназначенное для приема, хранения и выдачи структурированных цифровых данных. Также известно под названиями "информационное хранилище" (Information Store), "база данных" (Data Base), "архив данных" (Data Repository), хранилище данных (Data Warehouse).
Активное хранилище данных (Active-User Data Store)
Хранилище данных, в основном предназначенное для взаимодействия его содержимого с текущими и активными деловыми операциями и аналитическими процессами. Также известно, как "оперативное хранилище данных" (Operational Data Store), "оперативная база данных" (Operational Data Base), "хранилище проектных данных" (Project Data Store), "проектная база данных" (Project Data Base).
Долговременное хранилище данных (Long-Term Data Store)
Хранилище данных, в основном предназначенное для приема и долговременного хранения с редкой, основанной на запросах, выдачей данных. Также известно, как "центральное хранилище данных" (Master Data Store), "центральная база данных" (Master Data Base), "корпоративное хранилище данных" (Corporate Data Store), "корпоративная база данных" (Corporate Data Base), "хранилище данных" (Data Warehouse), "хранилище данных о результатах" (Results Data Store), "хранилище данных активов" (Asset Data Store).
(Глоссарий будет дополнен новыми статьями)

Термины и понятия в каталогизации E&P

Каталог (Catalogue)
Набор каталожных статей для единиц информации, главным образом общего назначения (в отличие от специальной информации - характерной для отдельных дисциплин).
Атрибут каталога (Catalogue Attribute)
Тип метаданных, определенный в каталожной статье.
Класс атрибута каталога (Catalogue Attribute Class)
Один из наборов взаимосвязанных атрибутов каталога, в частности, контекстуальных, библиографических, сферы действия, взаимосвязей, применения, управления и технических.
Контекстуальный атрибут каталога (Contextual Catalogue Attribute)
Атрибут каталога, который описывает единицу информации в терминах ее значения для делового процесса. Эти термины включают класс информационной единицы, деловые процессы производителя и потребителя, тип информации, отрасль знания производителя и потребителя, тип активов, идентификацию активов, а также ссылочное наименование информационной единицы.
Информационная единица (Information Item)
Единица знаний-информации-данных, генерированная, хранимая, поддерживаемая и извлекаемая как таковая. В широком понимании существует два вида информационных единиц: документы, являющиеся единицами, генерированными для хранения в качестве единиц с ненарушаемым интеллектуальным содержанием, и результаты запросов в цифровых базах данных, которые генерируются для выполнения задач первой необходимости. Примечание: эти два класса могут пересекаться. [Соотносится с шаблоном информационной единицы, представляющей собой виртуальную информационную единицу, связанную с определенным запросом цифровой базы данных, в котором некоторые значения ключа/идентификатора не указаны (до исполнения запроса), извлекающие реальную информационную единицу. При расширении шаблонная информационная единица может быть занесена в каталог как средство распознания соответствующих запросов, которые в последствии могут быть выполнены].
Знания-информация-данные (Knowledge-Information-Data)
Общее понятие интеллектуального материала, включающего знания (ориентированные на действие), информацию (контекстуальную и смешанную) (contextual and composite) и данные (фактический материал наблюдений и измерений). Также называется З-И-Д или информация (в том числе и в данном значении). Можно представить в качестве справки: знания - это… информация - это… данные - это…
Класс информационной единицы (Information Item Class)
Контекстуальный атрибут каталога, описывающий информационную единицу в терминах ее интеллектуальной формы и формата. В проекте "Дискавери" Shell Expro известен как "группа продукта". Соотносится с иерархией классов информационной статьи. См. Справочные значения - См. "Модель классов информационной статьи POSC" (POSC Information Item Class Model for standard values).
Деловой процесс (Business Process)
Общий процесс, описывающий ряд образующих единое целое деловых операций. Соотносится с иерархией делового процесса. Справочные значения - См. "Модель общего делового процесса POSC" (POSC Information Item Class Model for standard values). Соотносится с деловым процессом производителя информационной единицы, контекстуальным атрибутом каталога, описывающим информационную единицу в терминах делового процесса, в котором она создается. В проекте "Discovery" Shell Expro известен как "деловой процесс". Соотносится с деловым процессом потребителя информационной единицы, многозначным контекстуальным атрибутом каталога, описывающим информационную единицу в терминах делового процесса, в котором он обычно используется в качестве основного ресурса.
Тип информации (Information Type)
Контекстуальный атрибут каталога, описывающий информационную статью в терминах классификации ее З-И-Д. В проекте "Discovery" Shell Expro известен как "Тип З-И-Д" (KID Type).
Отрасль знания (Discipline)
Классификация научной и инженерной специальности. Соотносится с иерархией отраслей знания. Эталонные значения - См. "Модель отраслей знания POSC" (POSC Discipline Model for standard values). Соотносится с отраслью знания производителя информационной статьи, контекстуальным атрибутом каталога, описывающим информационную статью в терминах отрасли знания, в которой она в основном создается. В проекте "Discovery" Shell Expro известен как "Отрасль знания производителя" (Producer Discipline). Соотносится с отраслью знания потребителя информационной статьи, многозначным контекстуальным атрибутом каталога, описывающим информационную статью в терминах отрасли знания, с которой обычно связано ее первоначальное использование. В проекте "Discovery" Shell Expro известен как "Отрасль знания потребителя".
Тип активов (Asset Type)
Классификация активов корпорации. Соотносится с иерархией типов активов. Эталонные значения - См. "Модель типов активов POSC" (POSC Asst Type Model for standard values). Используется в качестве контекстуального атрибута каталога, описывающего тип активов корпорации, относящихся к определенной информационной статье.
Идентификатор активов (Asset ID)
Идентификатор конкретных активов корпорации. Эталонные значения типа, региона и т.д. - См. "Модель активов POSC" (POSC Asset Model for standard values by type, region, etc). Используется в качестве контекстуального атрибута каталога, который, вместе с атрибутом "тип активов" определяет конкретные активы корпорации, относящиеся к определенной информационной единице.
Ссылочное наименование информационной статьи (Information Item Reference Title)
Производный контекстуальный атрибут каталога, состоящий почти из всех основных контекстуальных атрибутов, и служит в качестве теоретического наименования информационной статьи. См. "Модель ссылочного наименования информационной статьи POSC" (POSC Information Item Reference Title Model).
Словарь каталога(Catalogue Vocabulary)
Сборник атрибутов каталога и наборов их справочных значений. См. "Модель каталога POSC" (POSC Catalogue Model).

Ссылки на использованные документы

  • Дублинский сборник основных элементов метаданных, Версия 1.1: Описание ссылок
  • Семинар по обработке информации корпораций DTI, CDA, POSC и Shell Expro, 22 марта, 2002 г.
    (http://www.posc.org/presentation/mar02)
  • Shell Expro и Flare Consultants Ltd., Проект "Дискавери" - "Мысля иначе, Общий сборник метаданных "Discovery", версия 3.0, март 2002 г.
  • Документ POSC/Shell и семинар по каталогизации данных, 30 сентября 2002 г.
    (http://www.posc.org/presentations/sep02Cat)
  • Протокол совещания группы POSC DSS SIG, 17 октября 2002 г.
    (http://www.posc.org/meetings/oct02DSS)
  • Издание спецификации по каталогизации корпорации Flare, октябрь-ноябрь 2002 г.
  • Протокол совещания группы POSC DSS SIG, 18 ноября 2002 г.
    (http://www.posc.org/meetings/nov02DSS)
  • Семинар по каталогизации документов и данных POSC, 4 декабря 2002 г.
    (http://www.posc.org/presentations/dec02Cat)
  • Протокол совещания группы POSC DSS SIG, 5 декабря 2002 г.
    (http://www.posc.org/meetings/dec02DSS)

Перечень участников

[В данный перечень включены действующие и перспективные участники.]
  • Нефтяные компании
    • Anadarko
    • Eni Agip
    • ExxonMobil
    • ONGC
    • Pioneer Resources
    • Shell
    • Statoil
  • Государственные учреждения
    • NPD, Норвегия
    • Министерство торговли и промышленности Великобритании
    • MMS, США
  • Компании по обслуживанию, разработке программного обеспечения и консультированию
    • ETL Solutions
    • Flare
    • Halliburton/Landmark
    • IMS Corporation
    • Oilware
    • Paras
    • Petris Technology
    • Schlumberger
  • POSC

Тел.: (495) 609 6115
Тел.: (495) 609 6017
Факс: (495) 609 6288
E-mail:upeg@upeg.net

Все права принадлежат ОАО "ОЭГ "Петросервис"
Дизайн, верстка: Рогаткин Николай
Россия, 127422, Москва
Дмитровский проезд, д. 10