Автоматизированная оцифровка круговых диаграмм
- 1 — канд. техн. наук научный руководитель проекта Санкт-Петербургский горный университет ▪ Orcid ▪ Elibrary ▪ Scopus ▪ ResearcherID
- 2 — канд. техн. наук научный руководитель проекта учебно-научного центра цифровых технологий Санкт-Петербургский горный университет ▪ Orcid ▪ Elibrary ▪ Scopus ▪ ResearcherID
- 3 — стажер-Исследователь Санкт-Петербургский горный университет ▪ Orcid ▪ Elibrary
- 4 — д-р физ.-мат. наук заведующий кафедрой Томский политехнический университет ▪ Orcid ▪ Elibrary ▪ Scopus
Аннотация
Круговые диаграммы использовались в промышленности для возможности ретроспективной оценки технологических параметров. Сегодня актуальна оцифровка полученных данных для упрощения процесса автоматизации технологических процессов. Оцифровка круговых диаграмм стандартными методами производится с привлечением человеческого труда при значительных временных затратах. В статье предложен автоматизированный метод оцифровки круговых диаграмм с помощью программного обеспечения, разработанного при использовании среды разработки LabVIEW. Результаты обработки круговых диаграмм выводятся на экран в численном и графическом виде, а также могут быть экспортированы в файл (например, в Блокнот или MS Excel). Представленная методика применима для изображений, полученных на цветном или черно-белом сканере, что обеспечивает минимизацию геометрических искажений, связанных с преобразованием бумажного документа в электронный вид, и обеспечивает качество распознавания четкой линии графика с относительной погрешностью в среднем до 3 %. В случае выцветания чернил или перспективной съемки диаграммы на фотоаппарат значение относительной погрешности может достигать 8 %, вследствие чего потребуется дополнительная ручная корректировка данных.
Введение. Повсеместное распространение бумажных самописцев на предприятиях химической, металлургической, горной и других отраслей промышленности в середине прошлого века было связано с необходимостью накопления и оценки данных о технологических процессах [5, 14, 21, 26]. На основе получаемых значений можно было прогнозировать варьирование режимов работы агрегатов в зависимости от изменения входных параметров системы, а также определять возможность возникновения аварийных ситуаций и преждевременно предотвращать их. По мере возникновения интеллектуальных систем управления технологическими процессами, в том числе SCADA, MES и др., возникла возможность значительного упрощения работы операторов и сведения полученных данных в формы, легко воспринимаемые человеком [13, 5, 24].
В настоящий момент на территории РФ осуществляется переход к цифровым технологиям, предполагающий как повсеместную автоматизацию технологических процессов, так и создание интеллектуальных систем-помощников на основании архивных данных по ведению технологического процесса [11, 25, 28]. На ряде производств реализуется хранение данных, полученных с самописцев в различном графическом виде в архивах, при этом некоторые лаборатории до недавнего времени использовали при проведении опытов бумажные самописцы [8].
Для минимизации объема бумажных архивов, а также упрощения доступа к архивным данным целесообразно использование автоматизированных систем оцифровки данных, полученных при использовании бумажных самописцев [3, 12, 14].
Постановка проблемы. В статье рассматривается один из видов графического представления данных, получаемых с самописца, а именно круговые диаграммы. Круговая диаграмма – это график в полярной системе координат, представляющий собой сетку (совокупность окружностей и дуг времени) и одну или две кривые (графики температуры, перепада давления и т.д.). Они используются на производстве для регистрации температур, давлений, влажностей и прочих параметров за конкретный промежуток времени. Из-за глобальной компьютеризации и стремления к автоматизации появилась необходимость перевода архивов с диаграммами в цифровой вид. Обработка круговых диаграмм предполагает активное участие человека, на обработку каждой диаграммы тратится большое количество времени. Кроме того, так как диаграммы обрабатываются планиметрами, точность обработки получается низкой и основной параметр вычисляется с большой погрешностью.
В связи с изложенным возникает необходимость разработки эффективных методов и алгоритмов автоматического распознавания кривых на цветных изображениях круговых диаграмм, что относится к задачам распознавания образов [3, 5, 6], поскольку необходимо «выделить» точки графика среди остальных точек. Реализация подобных методик осложнена тем, что диаграмма может содержать различные помехи: пятна, царапины, случайные обрывы линий. Для решения проблем подобного рода был разработан алгоритм автоматического распознавания кривых на цифровых изображениях круговых диаграмм.
Целью исследования является разработка программного продукта, который позволит автоматизировать процесс перевода растрового изображения в цифровой вид. Рассматривается программа оцифровки круговых диаграмм с растровых изображений, регистрирующих изменения температуры в нагревательной печи, установленной в кузнечнопрессовом цехе для подготовки стальных слитков к ковке. Однако предложенный метод универсален: его можно использовать для оцифровки любых круговых диаграмм.
Существуют различные программные продукты для оцифровки линейных данных (представленных в декартовой системе координат) в графическом виде. Однако их инструменты не позволяют обрабатывать круговые диаграммы из-за принципиального отличия полярной и декартовой систем координат.
Для достижения поставленной задачи было принято решение разработать алгоритм и реализовать собственный программный продукт на базе LabVIEW [9, 20, 30]. LabVIEW является средой разработки, созданной и реализуемой компанией National Instruments (США). На базе LabVIEW [15] возможно создание программных продуктов при использовании графического языка программирования G, что облегчает как процесс его изучения, так и применения в разработке программ. Инструментарий среды разработки состоит из базовых функций работы с данными и дополнительных модулей, обеспечивающих расширение функционала среды разработки (системы машинного зрения, взаимодействие с MS Office, подключение к базам данных и др.). Функционал LabVIEW позволяет создавать стандартные WINDOWS-приложения для персональных компьютеров с интуитивно понятным интерфейсом. Все перечисленные преимущества и обусловили использование данной среды разработки для собственного программного обеспечения.
Методика исследований. Разработка и реализация программного продукта рассмотрена на примере оцифровки круговых диаграмм с растровых изображений, регистрирующих изменения температуры в нагревательной печи, установленной в кузнечнопрессовом цехе для подготовки стальных слитков к ковке.
Изначально необходимо было учесть специфику круговых диаграмм, поступающих на оцифровку. На рассматриваемых круговых диаграммах (рис.1) удаление от центра показывает значение температуры в градусах Цельсия, а полярный угол φ показывает время измерения в часах, с точностью до 4 мин.
Программа написана с использованием библиотеки LabVIEW IMAQ Vision (программное обеспечение для разработки приложений машинного зрения и обработки изображений, в том числе реального времени) [10, 23]. Для выполнения математических операций и вывода на экран результатов оцифровки используются встроенные библиотеки из панелей Mathematics и Programming соответственно. Этапы работы алгоритма показаны на рис.2.
Входными данными могут быть фотографии или сканированные изображения диаграмм. Вторые предпочтительнее, поскольку полностью исключают перспективные искажения, а, следовательно, и уменьшают величину инструментальной ошибки при анализе и обработке изображения. Загруженные файлы при необходимости преобразовываются из цветной палитры в оттенки серого, что позволяет ускорить процесс обработки, учитывая, что объект (линия графика), область интереса (сетка диаграммы) и фон (поверхность, на которой лежит диаграмма) достаточно контрастны и не совпадают по цвету.
В ходе предобработки изображения выполняется процедура «пороговой бинаризации». Изображение разделяется на две области, одна из которых ниже порогового значения, а другая выше. В данном решении использовался алгоритм адаптивной бинаризации, который базируется на использовании локальной и глобальной гистограммы изображения. Оптимальная пороговая сегментация достигается за счет представления некоторой кривой, использующей весовые суммы двух и более вероятностей интенсивности с нормальным распределением. При этом пороговое значение соответствует минимуму вероятности между максимумами двух и более нормальных распределений. В программе реализован алгоритм автоматической настройки диапазонов яркости (подход Otsu, предложенный в 1979 г.) и, при необходимости, более тонкой ручной обработки. В результате последовательно удаляется фон, а затем и координатная сетка на диаграмме, что позволяет исключить грубые ошибки при анализе изображения [1, 17].
Далее определяется область интереса изображения путем автоматического (или при необходимости ручного) выделения поля диаграммы (минимальное и максимальное значение шкал времени и температуры, как показано на рис.3). Таким образом, дальнейшая обработка будет производиться над областью, которая представляет собой замкнутое или разомкнутое кольцо. На этом этапе требуется указать полярный угол, соответствующий началу отсчета времени в полярной системе координат.
Методика автоматического распознавания координат кривой приведена на рис.4. Кривая К имеет толщину G, маркер М – вспомогательная линия на диаграмме, движется против часовой стрелки вокруг центра, проходя через начало координат и вторую точку, которая задается параметрическим уравнением окружности x=x0+Mcos(φ); y=y0+Msin(φ) с шагом изменения угла φ = 1° угол φ соответствует 4 мин времени в системе координат исходной круговой диаграммы, а также ограничивается размерами области интереса.
Результатом работы этой процедуры являются координаты точки R (xR; yR) (первое пресечение кривой К и маркера М (см. рис.3), рассчитываемой по пороговому значению изменения яркости вдоль вспомогательной линии M, где 0 – белый фон, 1 – объект интереса, линия графика черного цвета (рис.5).
Результаты. Каждое пересечение маркера и графика кривой регистрируется. Координаты точек пересечения автоматически экспортируются в файл, а также выводятся на график зависимости температуры от времени в декартовой системе координат (рис.6). Если пересечение обнаружено не было – на месте координат будут записаны нули.
Перевод длины отрезка O,R в значение температуры T осуществляется с помощью коэффициента k. Этот коэффициент рассчитывается как отношение длины отрезка O,R к длине отрезка O,М оси температуры на исходной диаграмме (задаются вручную).
Полученные значения температуры T было решено подвергнуть сглаживанию с целью фильтрации полученного сигнала и устранению помех [8, 16, 19, 22]. Сглаживание (фильтрация) сигнала проводилось по методу скользящего среднего [4, 7]: за сглаженное значение искомого значения температуры T в любой точке t принимают ее среднее значение на интервале (t – 2l; t + 2l), где l – некоторое значение времени, принимаемое исследователем. При изменении t этот интервал скользит вдоль оси времени, чем и объясняется название метода. Таким образом, ординаты искомого значения температуры T(t) вычисляются по формуле
Как видно из формулы (1), чем больше интервал 2l, тем лучше сглаживание. Однако при очень большом значении l происходит сглаживание и самой функции T(t). Рекомендуется выбирать значение l не более 4. В данном случае l было принято равным 4.
Для проверки точности оцифровки результатов были выбраны 36 точек (каждое десятое значение) и определена относительная погрешность измерения по формуле
где Yэ и Yр – экспериментальное и расчетное значение определяемого параметра. Среднее значение относительной погрешности составило 2,14 %. Максимальное значение погрешности 7,95 % зафиксировано на участке с 1 до 2 ч (рис.6). Это объясняется возникновением шума на анализируемой круговой диаграмме (см. рис.5). Для времени с 3 до 10 ч (рис.6) погрешность составляет 0,09-0,9 %. С 14 до 24 ч (рис.6) погрешность оцифровки – в пределах 2 %.
Для подтверждения адекватности предложенной методики оцифровки круговых диаграмм аналогичным образом было проведено еще 45 испытаний по оцифровке изображений различного качества. Оцифровке подверглись отсканированные черно-белые и цветные изображения; снимки, сделанные на цифровой фотоаппарат и смартфон, высокого и низкого качества, с четкой линией графика и еле заметной линией.
Результат оцифровки изображений круговых диаграмм, полученных на цветном или черно-белом сканере, показал качественное распознавание четкой линии графика с относительной погрешностью в среднем до 3 %. В случае выцветания чернил или перспективной съемки диаграммы на фотоаппарат значение относительной погрешности может достигать 8 %, вследствие чего потребуется дополнительная ручная корректировка данных [18, 27, 29].
Выводы. Разработанная программа упрощает обработку круговых диаграмм, позволяя значительно сократить время и систематизировать многочисленные измерения. Уже на раннем этапе она почти полностью исключает влияние человеческого фактора на оцифровку.
Программа может быть использована на производстве для перевода результатов измерений с бумажных носителей в цифровой вид. Данная разработка защищена авторами свидетельством о государственной регистрации программы для ЭВМ № 2019612907 [12].
Литература