Контакты
Подписка
МЕНЮ
Контакты
Подписка

Проблемы архивирования медаконтента

В рубрику "Оборудование и технологии" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Проблемы архивирования медиаконтента

Артем Савельев
Журналист

Долгосрочное архивирование имело место еще в древние времена у различных цивилизаций. При этом выбранная стратегия показала своя настолько эффективной, что выдолбленную в камне информацию люди вполне способны разобрать и сейчас, спустя тысячи лет. Но современное человечество столкнулось с проблемой использования сведений, сохраненных сегодня, через несколько лет. Растущий объем цифровизации влечет за собой потребность в сохранении все большего объема данных, поэтому выбор правильного пути архивирования сегодня особенно актуален.

Ведь стремительное устаревание воспроизводящих средств (как следствие смены технологий) затрудняет доступ к материалам, сделанным в форматах видеозаписей предыдущих поколений. Все чаще становится невозможным использование архивных материалов из-за отсутствия как самих исправных воспроизводящих устройств, так и квалифицированных специалистов, которые умеют с ними обращаться. Более того, стоимость содержания зданий оборудованных хранилищ, в которых хранятся пленки и видеоленты, в несколько раз превышает стоимость технологического перевооружения.

Объем производства медиапродукта лавинообразно растет, и размер архивов (как в старых, так и в новых форматах) постоянно увеличивается. До недавнего времени это были преимущественно материалы стандартной четкости, но теперь существуют материалы, записанные в форматах ТВЧ (телевидение высокой четкости).

Долговременное хранение контента - динамичный процесс

Начинается он с правильного учета битов и байтов, включает в себя их структуризацию, хранение, распределение и архивирование. Таким образом, без специализированных систем управления контентом (систем управления корпоративным контентом - Enterprice Content Management, ECM) не обойтись.

За последние годы рынок ЕСМ претерпел важные структурные изменения. В их основе лежит коррекция потребностей заказчиков в области ЕСМ и новые возможности, открываемые развитием самих ИТ.

Большое значение при архивировании информации имеет формат, в котором должны храниться оцифрованные данные. Независимость от производителя в данном случае играет ведущую роль. Только таким образом можно избежать ситуации, когда в какой-то момент файл невозможно прочитать из-за того, что производитель перестал поддерживать какой-либо формат.

Поэтому идеальным вариантом в современных медиаархивах на первоначальной стадии обработки является перевод в файловую форму, имеющую возможность автоматически трансформироваться в новые форматы по мере их возникновения. Данная операция называется "инжестирование". В результате появляется так называемый мастер-файл, который существует в первозданном виде десятки лет. Инжестирование - важный момент в процессе архивирования, включающий в себя две основные составляющие: предварительная обработка материала (очистка аудио/видеоматериала) и его описание (добавление метаданных). Причем созданный на стадии инжестирования мастер-файл должен обладать следующими свойствами: высокое качество, пригодность как для хранения, так и для любых других применений (от передачи до редактирования).

Весь медиаконтент, который был ранее переведен в цифровую форму, необходимо грамотно упорядочить для того, чтобы обеспечить в дальнейшем простой поиск информации. Обработанные файлы затем необходимо классифицировать и разделить на основе метаданных. Такие сведения, как тип медиафайла, автор, права доступа и длительность хранения, помогают структурировать поток данных и позволяют найти требуемые материалы с помощью соответствующих приложений.

В крупных медиакомпаниях, где ежедневно обрабатываются большие объемы данных, рассматриваемый этап работы может стать затруднительным. В этом случае могут выручить программные модули, автоматизирующие классификацию данных. В дальнейшем результаты классификации используются при распределении по категориям или рассматриваются как ключевые слова, входящие в метаданные контента.

Проблемы формирования непротиворечивых метаданных при генерации контента

Следует упомянуть, что встречаются затруднения с формированием непротиворечивых метаданных при генерации контента. Эта проблема значительно ограничивает возможности дальнейшего поиска и программной обработки информации. При поступлении данных соответствующая программа автоматически предлагает метаданные, которые пользователь может принять или отклонить.

Количество носителей должно быть как можно меньшим, чтобы упростить их администрирование и сделать системы пригодными для будущих потребностей. Дисковые хранилища на базе технологии CAS (Content Addressed Storage) позволяют архивировать информацию, предназначенную для длительного хранения и не подлежащую изменениям. В сочетании с системами управления контентом такой способ хранения обеспечивает быстрый интерактивный доступ к архивным данным. Архивы CAS обладают такими свойствами, как защита архивных данных посредством массивов RAID, автоматическая миграция на новые поколения аппаратного обеспечения, программируемое удаление информации, интегрированное управление правами.

Необходимо обратить внимание на тот факт, что медиакомпании рассматривают свои системы как единый комплекс, в который входят следующие ключевые подсистемы: управление 1Т-инфраструктурой, ERP-систе-ма (учетные задачи и планирование ресурсов), управление контентом, аналитика. Реализация подобной системы возможна только на базе интеграции различных функциональных компонентов, что и повлекло за собой выход на лидирующие позиции мега-вендоров - многопрофильных производителей софта, в основе которого лежит базовое ПО, преимущественно платформенного уровня.

Софтверные мегавендоры вышли в лидеры

За последние 5-6 лет в результате активного поглощения специализированных ЕСМ-разработчиков, а также развития собственных технологий в лидеры вышли софтверные мегавендоры. Ключевыми из них являются ЕМС, IBM, Microsoft, Open Text, Oracle, SAP, Xerox. Эта тенденция объясняется не только желанием ведущих ИТ-игроков освоить для себя новые быстрорастущие направления, но и тем, что развитие ЕСМ-средств во многом опирается на их интеграцию с ПО платформенного уровня. Необходимо также учитывать, что новые игроки вносят в эту сферу собственное понимание ЕСМ-сегмента в общей структуре ИТ-рынка, пытаясь направлять развитие этих средств в нужном для поставщиков русле (причем интересы вендоров и их представления о "русле" порой не совпадают).

ЕСМ-поставщики предлагают широкий спектр решений в этой области, фокусируясь в последнее время на процесси-онно-ориентированных приложениях и наборах базовых контент-сервисов (basic content services, BCS). ЕСМ-рынок за последнее время претерпел серьезные структурные изменения, в том числе с точки зрения требований пользователей, вследствие чего изменился состав параметров и критерии ранжирования вендоров. ЕСМ является комплексным понятием, объединяющим методики и технологии, предназначенные для решения важных задач, связанных с управлением документами и другой неструктурированной информацией.

Объем рынка ЕСМ в 2007 году составил S3 млрд и до 2011 года ожидается его рост на 13% в год. Это заметно выше темпов развития ИТ-рынка в целом, что обуславливается повышением спроса со стороны клиентов на подобные средства и общей трансформацией сегмента, в котором крупные инфраструктурные поставщики выбиваются в лидеры. В технологическом плане ставка делается на формирование в качестве базы комплекта BCS-средств, который дополняется специализированными решениями для более сложных приложений.

Характеристики рынка

Рынок характеризуется высоким уровнем консолидации поставщиков, которая, можно сказать, завершилась еще в 2006 году в результате слияния IBM с FileNet, Open Text с Hummingbird, Oracle c Stellent. При этом ведущие мегавендоры соревнуются в основном в сегменте high-end, в то время как Microsoft преимущественно доминирует в нижнем ценовом диапазоне предложений. Это создает проблемы для развития "чистых" игроков рынка, которые ориентируются сейчас лишь на средний рынок, предлагая контент-ориентированные предложения для вертикальных рынков (content-enabled vertical application, CEVA).

Таким образом, сегодня технологии ЕСМ направлены на поддержку работы с содержимым самых разных типов и форматов медиаконтента на протяжении всего его времени существования.

Упомянутый в самом начале древний метод долгосрочного архивирования, увы, неприменим для хранения энергозависимой информации. Поэтому медиакомпаниям следует обращать особое внимание на масштабируемость форматов, приложений и систем, так как с постоянным перевооружением и модернизацией имеющихся носителей и инфраструктуры ни одна компания в отдельности не справится собственными силами.




Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #2, 2009
Посещений: 10880

  Автор

 

Артем Савельев

Журналист

Всего статей:  8

В рубрику "Оборудование и технологии" | К списку рубрик  |  К списку авторов  |  К списку публикаций