Оцифровывать это что значит

Оцифровка

Оцифро́вка (англ. digitization ) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители.

Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.

Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Иногда термин «оцифровка» используется в переносном смысле, в качестве замены для соответствующего термина [уточнить] , при переводе информации из аналогового вида в цифровой. Например:

  • Оцифровка звука.
  • Оцифровка видео.
  • Оцифровка изображения.
  • Оцифровка книг — как сканирование, так и (в дальнейшем) распознавание.
  • Оцифровка бумажных карт местности — означает сканирование и, как правило, последующую векторизацию (растрово-векторное преобразование, т. е. перевод в формат векторного описания).

Содержание

Дискретизация

При оцифровке сигнала привязанного ко времени, дискретизацию обычно характеризуют частотой дискретизации — частотой снятия замеров.

При сканировании изображения с физических объектов, дискретизация характеризуется количеством результирующих пикселов на единицу длины (например, количеством точек на дюйм — англ. dot per inch, DPI ) по каждому из измерений.

Аналого-цифровое преобразование

Аналогово-цифровое преобразование характеризуется разрядностью преобразователя в битах.

Ссылки

  • Learning by Simulations A simulation showing the effects of sampling frequency and ADC resolution.

Литература

  • Хоровиц П., Хилл У. Искусство схемотехники: В 3-х томах: Т. 2. Пер. с англ.— 4-е изд., перераб. и доп.— М.: Мир, 1993.—371 с., ил. ISBN 5-03-002338-0.
  • Behzad Razavi, Principles of Data Conversion System Design. ISBN 0-7803-1093-4.

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое «Оцифровка» в других словарях:

оцифровка — оцифровывание Словарь русских синонимов. оцифровка сущ., кол во синонимов: 3 • копирование (44) • … Словарь синонимов

оцифровка — Процесс представления в цифровой форме данных, не являющихся дискрет ными. Пример Получить цифровое представление значения физической величины на основании аналогового представления этого значения. [ИСО/МЭК 2382 5] [ГОСТ Р 52292 2004] Тематики… … Справочник технического переводчика

оцифровка — 7.2.8 оцифровка: Процесс представления в цифровой форме данных, не являющихся дискретными. Пример Получить цифровое представление значения физической величины на основании аналогового представления этого значения. (ИСО/МЭК 2382 5) [2]. Источник:… … Словарь-справочник терминов нормативно-технической документации

оцифровка — оцифр овка, и … Русский орфографический словарь

оцифровка — Syn: оцифровывание … Тезаурус русской деловой лексики

Оцифровка — 1. Преобразование аналогового сигнала в цифровой Употребляется в документе: ПТЭ 2002 (Часть 2) Правила эксплуатации технических средств телевидения и радиовещания … Телекоммуникационный словарь

ОЦИФРОВКА — согласно ГОСТ Р 52292–2004 «Информационная технология. Электронный обмен информацией. Термины и определения», – процесс представления в цифровой форме данных, не являющихся дискретными … Делопроизводство и архивное дело в терминах и определениях

оцифровка — о/цифр/ов/к/а … Морфемно-орфографический словарь

оцифровка видеоизображений — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN video digitizing … Справочник технического переводчика

Оцифровка книг — Сверхпроизводительный сканер APT BookScan Оцифровка книг это процесс перевода бумажных книг в электронны … Википедия

Источник

Значение слова «оцифровка»

  • Оцифро́вка (англ. digitization) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители.

Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.

Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Иногда термин «оцифровка» используется в переносном смысле, в качестве замены для соответствующего термина[уточнить], при переводе информации из аналогового вида в цифровой. Например:

Оцифровка видео — перенос видеосигнала из внешнего источника с видеокассетой на цифровое устройство с последующей обработкой (сжатием, перекодировкой) и записью на цифровой носитель (dvd-диск, флеш-носитель, внешний жесткий диск);

Оцифровка книг — как сканирование, так и (в дальнейшем) распознавание.

Оцифровка бумажных карт местности — означает сканирование и, как правило, последующую векторизацию (растрово-векторное преобразование, т. е. перевод в формат векторного описания).

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой. Оцифровкой занимаются специализированные профессиональные студии (ТВ- и звукозаписывающие) и частные компании.

оцифро́вка

1. техн. действие по значению гл. оцифровывать, оцифровать; преобразование (аналоговых) сигналов, данных и т. п. в цифровую форму, предназначенную для обработки или хранения в виде чисел

2. социол. определение количественных характеристик

Делаем Карту слов лучше вместе

Привет! Меня зовут Лампобот, я компьютерная программа, которая помогает делать Карту слов. Я отлично умею считать, но пока плохо понимаю, как устроен ваш мир. Помоги мне разобраться!

Спасибо! Я стал чуточку лучше понимать мир эмоций.

Вопрос: услаждение — это что-то нейтральное, положительное или отрицательное?

Источник

Что значит Оцифровка?

Моя студия занимается оцифровкой почти всех существующих форматов, так что давайте разберемся что же это значит и зачем это нужно.

Оцифро́вка (англ. digitization) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители. (©Википедия)

Проще говоря процесс оцифровки- это перевод какой-либо аналоговой величины в цифровую форму.
Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Оцифровка бывает нескольких видов:
• Оцифровка звука;
• Оцифровка видео;
• Оцифровка киноплёнки;
• Оцифровка изображения;
• Оцифровка архивных документов — сканирование, каталогизацияи создание электронного архива
• Оцифровка книг — как сканирование, так и в дальнейшем распознавание;
• Оцифровка бумажных карт местности — означает сканирование и, как правило, последующую векторизацию (растрово-векторное преобразование, т. е. перевод в формат векторного описания).

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой.

С тем что такое оцифровка мы разобрались, но зачем же она нужна?
А вот зачем. Информация представленная в аналоговой форме имеет свойство искажаться, портиться, а то и вовсе будет утеряна в результате старения носителя. Так, например, магнитные ленты в видеокассетах со временем размагничиваются, осыпаются, что несомненно отражается на качестве картинки, и спустя какое-то время видео может просто не поддаться восстановлению. В противовес аналоговому носителю возьмем цифровой DVD диск. Производители заявляют, что эксплуатационный срок диска составляет 100 лет. Так ли это? Возможно при правильном хранении, но в любом случае, срок хранения увеличивается в разы, а это десятки лет, да и цифровые данные всегда можно залить в интернет и на облако, где они уж точно будут храниться чуть ли не вечно. Однако срок хранения не единственное преимущество цифрового перед аналоговым, не менее важным фактором является то, что при копировании с цифры на цифру мы абсолютно не теряем качества, в то время как при перезаписи аналоговых данных с каждой новой копией теряется 15% и это число возрастает по экспоненте от копии к копии.

Подведем итоги, цифровая революция свершилась. Аналоговые носители перешли в разряд ретро и используются в основном энтузиастами и художниками. Для лучшего качества, удобного хранения и быстрого доступа к данным используйте цифровые форматы данных, а если у вас есть что-то старое нуждающееся в оцифровке, то приносите нам, мы знаем что делать!

Источник

Что такое оцифровка?

Сканирование, ретроконверсия и сопутствующие услуги. Обзор технологий перевода документов в электронный вид.

Существует несколько вариантов организации процессов оцифровки. Они могут производиться самостоятельно или с аутсорсингом услуг, с вывозом документов или выполнением работ на своей территории. При оцифровке могут применяться офисные, профессиональные документные или планетарные сканеры. Данные могут извлекаться в ручном, полуавтоматическом или автоматическом режимах, с проведением предварительной архивной обработки бумажных документов или классификацией информации уже в электронном виде и т.д.

Какой путь выбрать?

Решение зависит от конкретной задачи, потому что каждое из вышеупомянутых «или» определяет качество получаемого результата и стоимость работ. Например, извечен вопрос сшитых документов: выгодней медленно отсканировать в сшитом состоянии или потратиться на расшивку, зато быстро оцифровать на документных сканерах?

Самый простой способ выбрать наиболее подходящий для вас путь – обратиться за экспертизой к специализирующейся на оцифровке организации. Заинтересованные в работах, крупные компании проведут обследование бесплатно, и за вас определят оптимальный подход. Не пренебрегайте этой возможностью и не ждите склонения к заказу услуг: большинство этих компаний также заинтересованы в поставке оборудования и ПО для самостоятельной оцифровки.

Сколько документов нужно сканировать?

Определяющий параметр – объем документов.

Определяющий параметр – объем документов. Для ежедневного сканирования небольших пачек расшитых документов (например, первичной бухгалтерии) подойдет обычный офисный сканер, выдерживающий нагрузку в несколько тысяч страниц в день. Нужно лишь дополнить его удобной программой для индексирования.

Для регулярного сканирования больших объемов необходимо профессиональное оборудование. Это – промышленные сканеры, которые стоят немалых денег (подобное оборудование используют ФНС, ФТС, крупные банки). Поэтому менее дорогой альтернативой может стать рамочное соглашение на оказание периодических услуг оцифровки.

Перевод в электронный вид больших ретроспективных массивов своими силами экономически не обоснован: помимо закупки оборудования и обучения сотрудников, потребуются значительные трудовые и временные затраты. Однозначно эффективнее заказывать услугу, так как крупная компания может выделить большой штат и решить задачу оперативно.

Где сканировать документы?

Определяющий параметр – востребованность сканируемых документов. Влияет ли на деятельность организации изъятие документов на время сканирования? Особенно это критично при оцифровке документов, к которым регулярно обращаются сотрудники, либо которые могут быть внезапно запрошены контролирующим органом, а также для устранения связанных с документами ЧП. Примеры: финансовые и кадровые документы, техническая и эксплуатационная документация, книги ЗАГС и другие отраслевые фонды.

Участок сканирования, организованный в помещениях компании-заказчика услуг.

Если необходимо оцифровать их достаточно быстро, то традиционным подходом является заказ услуг с выездом бригады сканирования на вашу территорию. Зачастую это оказывается дешевле, чем доставлять документы на производство исполнителя и обратно, но все определяет территориальная удаленность. Регламент выездных работ подразумевает сканирование выданного дела в течение одного-двух рабочих дней, без длительного изъятия из рабочего процесса.

Расшивать ли документы?

Определяющие параметры: состояние документов и возможность расшивки. Если есть такая возможность, и бумага пригодна для протяжки документным сканером, то следует расшивать. Дело в том, что сканирование сшитых документов на планетарном (книжном) сканере в несколько десятков раз медленнее потоковой оцифровки. Пропорционально увеличиваются время работ и стоимость труда. Сканирование на документных сканерах, даже с учетом расшивки, оперативнее и дешевле.

Расшивать можно самостоятельно, а можно доверить это исполнителю.

Расшивать можно самостоятельно, а можно доверить это исполнителю: если выбрана авторитетная компания, опасаться утраты документов не стоит. Наоборот, жесткая регламентация всех процессов и качественные материалы позволяют компаниям застраховаться от дополнительных финансовых потерь и ущерба имиджу. Этому подходу доверяют даже российские суды: при организации сканирования обычно внутренним приказом разрешается расшивка и последующая сшивка судебных дел.

К слову, крупные компании параллельно могут провести профессиональную архивную обработку: во-первых, часть работ итак выполняется при подготовке к сканированию, во-вторых, архивная обработка помогает выявить невостребованные документы и сократить объемы сканируемых массивов, что может снизить стоимость работ.

Какое качество выбрать?

Сегодня высококачественно можно отсканировать любой объект: от маленькой библиотечной карточки до карт формата 8А0 и театральных декораций.

Определяющие параметры: вид документа и объем получаемого ресурса в электронной форме. Сегодня сканирующее оборудование позволяет получать образы с разрешением от 200 до 1200 точек на дюйм (dpi). Для художественных произведений обычно применяется разрешение 400–600 dpi, позволяющее создавать высококачественные репродукции. Более высокое качество используется только при необходимости увеличения изображения и детализации мелких предметов, например, монет.

Детализированные и неконтрастные чертежи, часто выполненные на кальке и синьке, нуждаются в сканировании с разрешением 300-400 точек на дюйм и дополнительной обработке изображений в графических редакторах. Остальные документы обычно сканируются с разрешением 300 dpi, достаточным для распечатки копий без потери качества. Необходимая обрезка изображений, геометрическое исправление, цветокоррекция, конвертация в форматы pdf, tiff, jpegи др. может проводиться в полностью автоматическом режиме программами, встроенными в сканирующее оборудование или поставляемыми вместе с ним.

В большинстве случаев используется цветной режим съемки. Это нужно для всех документов, в которые вносились исправления или ставились печати поверх текста, для удостоверения того, что электронная копия снималась с оригинала документа с печатью и подписью, а также для читаемости угасающих текстов и передачи уникальных особенностей оригинала. Необходимость цветного сканирования художественных произведений не обсуждается. Режим «градации серого» применяется лишь в некоторых случаях: когда документы не содержат цветных атрибутов, либо когда необходимо сократить объем получаемого электронного ресурса.

Сканирование может осуществляться самостоятельно. Главной задачей становится обучение сотрудников правильной работе со сложной техникой, так как качество получаемых изображений важно для последующего индексирования: плохо отсканированный документ, тени, засветка и другие дефекты на электронном образе могут сделать нечитаемой важную информацию. Это не позволит применить технологии автоматического извлечения данных и может привести к ошибкам в индексировании. Загрузка ошибочных данных в некоторые системы (государственные реестры, бухгалтерские учетные системы) не позволительна.

Индексирование

Простое сканирование применяется редко, поскольку при последующей работе искать информацию в наборе графических файлов будет лишь немногим проще перелистывания бумаги. Для возможности поиска необходимо выделить в документе несколько атрибутов (индексных полей).

Сотрудники, задействованные в массовом индексировании документов методом ручного ввода.

Выделенные атрибуты можно внести в имя файла. Такая практика сложилась в российских судах: для того чтобы оператор сканирования не имел доступа к внутренним системам суда, при оцифровке все необходимые реквизиты вносятся в имя файла. В последующем эти реквизиты распознаются системой судопроизводства при загрузке каждого документа по отдельности.

Но обычно оцифрованные документы загружаются в информационную систему группой, что требует создания базы данных. Так, если необходимо прикрепить документ к уже существующей карточке в учетной системе, бывает достаточно извлечь пару однозначно определяющих его реквизитов – обычно номер и дату.

Если же нужно сформировать поисковую базу на основании самих документов, то объем извлекаемых данных определяется задачей: от пары реквизитов для поиска файла в электронном архиве до переноса всей значимой информации в аналитическую БД (ФИО, адресов, ИНН, КПП, дат, номеров документов-приложений и т.д.).

Свои правила индексирования применяются в музеях, библиотеках и архивах при оцифровке единиц хранения и учетных документов. Отдельным направлением услуг также является векторизация, которая применяется, в частности, при оцифровке каротажных лент (автоматическая) и чертежей (ручная отрисовка в CAD-системах).

Сколько данных извлекать?Ответ на этот вопрос также лучше получить, воспользовавшись экспертизой, так как количество извлекаемых реквизитов зависит от функциональной задачи и в значительной мере определяет стоимость оцифровки. В некоторых случаях можно ограничиться подборками документов, когда электронные образы объединяются под эгидой основного документа (например, договора или реестра счетов). В других необходимо извлечение всех содержащихся в документе данных для заполнения карточки информационной системы.

Примеры извлекаемых данных

Анализ размещенных на портале zakupki.gov.ru заказов компаний с государственным участием и госучреждений (44-ФЗ, 223-ФЗ), показывает, что:

– Для привязки электронных копий ОРД к системе электронного документооборота достаточно номера, даты и типа документа.

– Сканирование финансовой документации часто сопровождается извлечением номера, даты, наименований и реквизитов плательщиков, сумм.

– Оцифровка архивных документов муниципалитетов (постановления администраций, горисполкомов, сельсоветов и т.д.) в целях оказания услуг и инвентаризации объектов земельно-имущественных отношений требует извлечения номера и даты документа, всех встречаемых ФИО и адресов. Причем адреса необходимо сопоставлять с текущими справочниками КЛАДР/ФИАС.

– Оцифровка документов Архивного фонда РФ сопровождается строгим заполнением НСА и описанием фондов в соответствии с архивным законодательством.

– Индексирование описей и реестров подразумевает распознаванием всех порядковых записей.

– Для работы с чертежами в электронном виде необходимо извлечь практически все поля штампа.

– Сканирование составных дел требует не только извлечения реквизита каждого документа, но и установления взаимосвязей. Наиболее сложен случай конструкторской документации, где формируемая база данных обладает многоуровневой иерархией и связями документов.

Источник: zakupki.gov.ru, 2015

Какие методы извлечения данных выбрать?

Определяющий параметр – качество текста. Применяемые технологии, скорость и стоимость формирования баз данных зависят от того, как написан и в каком состоянии находится текст документа.

Напечатанный на современном принтере текст может быть автоматически распознан, необходимые данные могут быть извлечены с использованием различных автоматизированных методов: применением шаблонов и автоэкстракцией индексов (алгоритмы определения ключевых слов, семантического анализа и т.д.). Эти методы быстрые, и в большинстве случаев их стоимость ниже цены ручного распознавания.

Напечатанные необычным шрифтом, в низком качестве или поврежденные тексты книг, газет, архивных документов распознаются не всегда или с недостаточной точностью. Поэтому в большинстве случаев требуется ручной ввод или, по крайней мере, ручная проверка сведений. Предварительно для каждого ресурса формируются или подключаются внешние справочники, которые помогают операторам индексирования и значительно ускоряют процесс.

Документы с рукописным текстом индексируются только вручную. Это гораздо более медленный и дорогой процесс. Поэтому крупные компании применяют уникальные технологии, служащие ускорению обработки и, соответственно, снижению цены без потери качества. Показателен пример официальной переписки: в этих документах традиционно реквизиты печатаются, а номер и дата проставляется вручную по факту, что делает невозможным полноценное программное индексирование.

Можно ли провести индексирование самостоятельно?

Альтернативой является технология извлечения данных с помощью анализа текста, применимая для любых документов, в том числе неструктурированных. Этот метод зачастую более доступен по цене, но предлагается только парой крупных компаний, так как требует накопления серьезной семантическо-морфологической базы для каждой отрасли деятельности.

Самостоятельное индексирование возможно, причем как ручное, так и автоматизированное. Но есть ограничения. Программу распознавания текста приобрести легко. Настроить извлечение данных сложнее: для формализованных (например, счет-фактура) и условно структурированных документов (например, договор) нужно программирование форм — мест и алгоритмов определения требуемых реквизитов. Однако программы стоят денег: распознавание текста обычно тарифицируется полистно (лицензия), а за создание шаблонов форм придется заплатить отдельно. Поэтому при оцифровке большого количества видов документов (около 40) стоимость этого метода сравнивается со стоимостью ручного индексирования.

Можно также вносить данные напрямую в информационную систему. Однако этот способ связан с высокой вероятностью ошибок, отследить которые в системе крайне сложно. При самостоятельном индексировании рекомендуется сначала создавать определенную базу данных, которую перед загрузкой можно проверить.

Именно так работают специализирующиеся на оцифровке компании: жесткая регламентация процесса, с протоколированием всех действий, и обязательная проверка сформированного массива ОКК позволяет минимизировать количество возможных ошибок. Например, корпорацией ЭЛАР в официальных договорах и контрактах используется стандартный критерий качества ≥99,8%. Теме выборы критериев качества будет посвящена одна из следующих статей.

Источник

Читайте также:  Что значит давать жару
Оцените статью