Применение квазислучайных множеств при планировании многокомпонентного градуировочного эксперимента

Cover Page
  • Authors: 1
  • Affiliations:
    1. Самарский государственный технический университет
  • Issue: Vol 1 (2024)
  • Pages: 356-358
  • Section: ЧАСТЬ I. Информационно-измерительная техника и технология
  • URL: https://vietnamjournal.ru/osnk-sr2024/article/view/632416
  • ID: 632416

Cite item

Full Text

Abstract

Обоснование. Планирование эксперимента является междисциплинарным разделом науки. Его основной задачей является достижение поставленных целей исследования минимальным числом измерений и образцов, а значит, экономия средств и времени.

В химическом спектральном анализе часто исследуются сложные смеси, включающие два и более компонента. На основании спектральных данных строится градуировочная модель, с помощью которой можно количественно определять концентрации веществ в образце. Модель строится на основании некоторой обучающей выборки (набора). Имея обученные модели, можно определить концентрации всех анализируемых компонентов из единичного спектра. Можно выделить три основных подхода к формированию градуировочного набора образцов: ручной, систематический и случайный.

Для создания градуировочного набора образцов нужны четкие критерии для его оценки. Критерии оценки качества обучающего набора для создания нескольких градуировочных моделей на одних и тех же спектральных данных ранее не были четко сформулированы. Как правило, принимают во внимание только отсутствие корреляции между концентрациями компонентов. Однако этого явно недостаточно, и в работе [1] была показана важность еще двух параметров: полноты и равномерности заполнения пространства эксперимента (ПЭ). Под ПЭ понимается квадрат, куб или гиперкуб, образованный диапазонами, огранивающими концентрации компонентов (факторов). Набор образцов, таким образом, представляется координатами точек в данном пространстве. Вручную выбрать оптимальный обучающий набор градуировочных образцов трудно даже для двухкомпонентной смеси, тем более для трех и более компонентов. Для этого используют специальные алгоритмы.

Для оценки качества обучающих наборов и их сравнения между собой требуются численные критерии. Наиболее неоднозначной является мера равномерности заполнения ПЭ. В качестве такого критерия в настоящей работе использована функция размаха [1]. Ее преимуществами по сравнению с другими критериями [2, 3] являются скорость расчета и четкая интерпретация полученных значений с точки зрения качества данных [4].

В данном исследовании рассматривается случайный подход к формированию градуировочного набора образцов. Использование случайных значений часто встречается при задании концентраций компонентов в обучающем наборе для градуировочного эксперимента в спектральном анализе. При случайном подходе обычно используется какой-либо программный генератор псевдослучайных чисел. Однако, как было показано в работе [5], создание качественного градуировочного набора этим методом требует относительно большого числа «случайных» образцов, что делает его неоптимальным.

В настоящей работе предлагается использование квазислучайных множеств [6], то есть множеств точек распределенных более равномерно, чем случайное множество, но не образующих строгую периодическую структуру. В спектральном анализе такой подход ранее не использовался.

Цель — найти двумерное квазислучайное множество, позволяющее достигнуть требуемых критериев качества градуировочного набора, используя минимальное число точек (образцов).

Методы. Рассматривался диапазон от 3 до 30 точек, где при каждом формировании набора высчитывались три критерия качества: коэффициент корреляции, функция размаха и незаполненность ПЭ. Последняя величина выражается как единица минус отношение площади образованного точками выпуклого многоугольника к общей площади. Хорошими будем считать следующие диапазоны критериев: 0–0,15 по корреляции и незаполненности, 0–0,2 — по функции размаха; допустимыми: 0,15–0,3 по корреляции и незаполненности, 0,2–0,4 — по функции размаха. Более высокие значения критериев считаются недопустимыми. Были исследованы четыре метода создания последовательностей: Соболя, Халтона, Хаммерсли и R2.

Результаты. Рассчитанные значения критериев отражены в табл. 1.

 

Рис. 1. Графические представления последовательностей

 

Таблица 1. Последовательности и критерии

Последовательность

Минимальное количество точек

Корреляция

Функция размаха

Незаполненность пространства

Соболя

16

0,012

0,392

0,234

Халтона

18

0,052

0,397

0,284

Хаммерсли

21

0,109

0,360

0,272

R2

27

0,009

0,234

0,296

 

Выводы. Среди квазислучайных последовательностей лучшими оказались последовательности Соболя и Халтона. С применением последовательности Соболя было достигнуто допустимое качество набора для 16 образцов; последовательностью Халтона — для 18 образцов.

Full Text

Обоснование. Планирование эксперимента является междисциплинарным разделом науки. Его основной задачей является достижение поставленных целей исследования минимальным числом измерений и образцов, а значит, экономия средств и времени.

В химическом спектральном анализе часто исследуются сложные смеси, включающие два и более компонента. На основании спектральных данных строится градуировочная модель, с помощью которой можно количественно определять концентрации веществ в образце. Модель строится на основании некоторой обучающей выборки (набора). Имея обученные модели, можно определить концентрации всех анализируемых компонентов из единичного спектра. Можно выделить три основных подхода к формированию градуировочного набора образцов: ручной, систематический и случайный.

Для создания градуировочного набора образцов нужны четкие критерии для его оценки. Критерии оценки качества обучающего набора для создания нескольких градуировочных моделей на одних и тех же спектральных данных ранее не были четко сформулированы. Как правило, принимают во внимание только отсутствие корреляции между концентрациями компонентов. Однако этого явно недостаточно, и в работе [1] была показана важность еще двух параметров: полноты и равномерности заполнения пространства эксперимента (ПЭ). Под ПЭ понимается квадрат, куб или гиперкуб, образованный диапазонами, огранивающими концентрации компонентов (факторов). Набор образцов, таким образом, представляется координатами точек в данном пространстве. Вручную выбрать оптимальный обучающий набор градуировочных образцов трудно даже для двухкомпонентной смеси, тем более для трех и более компонентов. Для этого используют специальные алгоритмы.

Для оценки качества обучающих наборов и их сравнения между собой требуются численные критерии. Наиболее неоднозначной является мера равномерности заполнения ПЭ. В качестве такого критерия в настоящей работе использована функция размаха [1]. Ее преимуществами по сравнению с другими критериями [2, 3] являются скорость расчета и четкая интерпретация полученных значений с точки зрения качества данных [4].

В данном исследовании рассматривается случайный подход к формированию градуировочного набора образцов. Использование случайных значений часто встречается при задании концентраций компонентов в обучающем наборе для градуировочного эксперимента в спектральном анализе. При случайном подходе обычно используется какой-либо программный генератор псевдослучайных чисел. Однако, как было показано в работе [5], создание качественного градуировочного набора этим методом требует относительно большого числа «случайных» образцов, что делает его неоптимальным.

В настоящей работе предлагается использование квазислучайных множеств [6], то есть множеств точек распределенных более равномерно, чем случайное множество, но не образующих строгую периодическую структуру. В спектральном анализе такой подход ранее не использовался.

Цель — найти двумерное квазислучайное множество, позволяющее достигнуть требуемых критериев качества градуировочного набора, используя минимальное число точек (образцов).

Методы. Рассматривался диапазон от 3 до 30 точек, где при каждом формировании набора высчитывались три критерия качества: коэффициент корреляции, функция размаха и незаполненность ПЭ. Последняя величина выражается как единица минус отношение площади образованного точками выпуклого многоугольника к общей площади. Хорошими будем считать следующие диапазоны критериев: 0–0,15 по корреляции и незаполненности, 0–0,2 — по функции размаха; допустимыми: 0,15–0,3 по корреляции и незаполненности, 0,2–0,4 — по функции размаха. Более высокие значения критериев считаются недопустимыми. Были исследованы четыре метода создания последовательностей: Соболя, Халтона, Хаммерсли и R2.

Результаты. Рассчитанные значения критериев отражены в табл. 1.

 

Рис. 1. Графические представления последовательностей

 

Таблица 1. Последовательности и критерии

Последовательность

Минимальное количество точек

Корреляция

Функция размаха

Незаполненность пространства

Соболя

16

0,012

0,392

0,234

Халтона

18

0,052

0,397

0,284

Хаммерсли

21

0,109

0,360

0,272

R2

27

0,009

0,234

0,296

 

Выводы. Среди квазислучайных последовательностей лучшими оказались последовательности Соболя и Халтона. С применением последовательности Соболя было достигнуто допустимое качество набора для 16 образцов; последовательностью Халтона — для 18 образцов.

×

About the authors

Самарский государственный технический университет

Author for correspondence.
Email: s90w23.14@mail.ru

аспирант

Russian Federation, Самара

References

  1. Bogomolov A. Diagonal designs for a multi-component calibration experiment // Analytica Chimica Acta. 2017. Vol. 951. P. 46–57. doi: 10.1016/j.aca.2016.11.038
  2. Liang Y.-Z., Fang K.-T., Xu Q.-S. Uniform design and its applications in chemistry and chemical engineering // Chemom Intell Lab Syst. 2001. Vol. 58, N 1. P. 43–57. doi: 10.1016/S0169-7439(01)00139-3
  3. Kirsanov D., Panchuk V., Agafonova-Moroz M., et al. A sample-effective calibration design for multiple components // The Analyst. 2014. Vol. 139, N 17. P. 4303–4309. doi: 10.1039/c4an00227j
  4. Leardi R. Experimental design in chemistry: a tutorial // Anal Chim Acta. 2009. Vol. 652, N 1-2. P. 161–172. doi: 10.1016/j.aca.2009.06.015
  5. Brown S.D., Tauler R., Walczak B. Comprehensive chemometrics. 2nd edit. Amsterdam: Elsevier, 2024.
  6. Кейперс Л., Нидеррайтер Г. Равномерное распределение последовательностей. Москва: Наука, 1985. 408 с.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Рис. 1. Графические представления последовательностей

Download (190KB)

Copyright (c) 2024 Мананков А.С.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.