Р 50.1.060-2006
Группа Т59
РЕКОМЕНДАЦИИ ПО СТАНДАРТИЗАЦИИ
Статистические методы
РУКОВОДСТВО ПО ИСПОЛЬЗОВАНИЮ ОЦЕНОК ПОВТОРЯЕМОСТИ,
ВОСПРОИЗВОДИМОСТИ И ПРАВИЛЬНОСТИ ПРИ ОЦЕНКЕ
НЕОПРЕДЕЛЕННОСТИ ИЗМЕРЕНИЙ
Statistical methods. Guidance for the use of repeatability, reproducibility
and trueness estimates in measurement uncertainty estimation
ОКС 03.120.30
Дата введения 2007-06-01
Предисловие
Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. N 184-ФЗ "О техническом регулировании", а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 "Стандартизация в Российской Федерации. Основные положения"
Сведения о рекомендациях по стандартизации
1 ПОДГОТОВЛЕНЫ Открытым акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем" (ОАО НИЦ КД) и Техническим комитетом по стандартизации ТК 125 "Статистические методы в управлении качеством продукции" на основе собственного аутентичного перевода стандарта, указанного в пункте 4
2 ВНЕСЕНЫ Управлением развития, информационного обеспечения и аккредитации Федерального агентства по техническому регулированию и метрологии
3 УТВЕРЖДЕНЫ И ВВЕДЕНЫ В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 19 декабря 2006 г. N 319-ст
4 Настоящие рекомендации являются идентичными по отношению к международному стандарту ИСО/ТУ 21748:2004 "Руководство по использованию оценок повторяемости, воспроизводимости и правильности при оценке неопределенности измерений" (ISO/TS 21748:2004 "Guidance for the use of repeatability, reproducibility and trueness estimates in measurement uncertainty estimation").
Наименование настоящих рекомендаций изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2004 (подраздел 3.5).
При применении настоящих рекомендаций рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении А
5 ВВЕДЕНЫ ВПЕРВЫЕ
Информация о введении в действие (прекращении действия) настоящих рекомендаций, изменениях и поправках к ним, а также тексты изменений и поправок публикуются в информационном указателе "Национальные стандарты"
Введение
Знание неопределенности, связанной с результатами измерений, является важным для интерпретации результатов. Без количественных оценок неопределенности невозможно решить, превышают ли наблюдаемые отклонения результатов экспериментальную изменчивость, соответствуют ли объекты испытаний установленным требованиям. Без информации о неопределенности существует риск неверного толкования результатов, а неправильные решения могут привести к ненужным расходам при производстве, неправильным судебным выводам, неблагоприятным последствиям для здоровья или неблагоприятным социальным последствиям.
Лаборатории, аккредитованные в соответствии с ИСО/МЭК 17025:2005 "Общие требования к компетентности испытательных и поверочных лабораторий", обязаны оценивать неопределенность результатов измерений и испытаний и составлять соответствующий отчет. Руководство GUM (Guide to the expression of uncertainty in measurement), изданное ИСО, основано на принятом стандартном подходе. Однако оно относится к ситуации, когда известна модель процесса измерений. Очень широкий диапазон стандартных методов испытаний может быть подвергнут совместному исследованию в соответствии с ИСО 5725-2:1994. Настоящие рекомендации устанавливают соответствующие методы оценки неопределенности результатов измерений и испытаний, основанные на принципах GUM при анализе общих данных.
Общий подход, используемый в настоящих рекомендациях, требует, чтобы:
- оценки повторяемости, воспроизводимости и правильности метода, полученные при совместном исследовании в соответствии с ИСО 5725-2:1994, могли быть получены по опубликованной информации об использовании метода испытаний. Эти оценки позволяют получать внутрилабораторные и межлабораторные составляющие неопределенности, а также оценку неопределенности результатов, связанную с правильностью метода;
- лаборатория подтвердила на основе проверок присущих ей смещения и прецизионности, что выполнение ею метода испытаний совместимо с установленными требованиями к методу испытаний. Это подтверждает, что опубликованные данные согласуются с результатами измерений и испытаний, полученными лабораторией;
- любые влияния на результаты измерений, которые не охвачены совместными исследованиями, были идентифицированы, а отклонения, вызванные этими воздействиями, определены количественно.
Оценку неопределенности определяют объединением оценок дисперсии, полученных в соответствии с GUM.
Для контроля полного понимания метода разброс результатов, полученных в совместном исследовании, часто полезно сравнивать с оценками неопределенности измерений, полученными с использованием процедур GUM. Такие сравнения будут более эффективны при использовании последовательных оценок одного и того же параметра, полученных на основе данных совместных исследований.
1 Область применения
Настоящие рекомендации дают руководство для:
- оценки неопределенности измерений на основе данных, полученных в результате исследований, проводимых в соответствии с ИСО 5725-2;
- сравнения результатов совместного исследования с неопределенностью измерений, полученной с использованием формальных принципов переноса неопределенности (см. раздел 14).
ИСО 5725-3 устанавливает дополнительные модели для анализа промежуточной прецизионности. Однако, хотя этот общий подход может быть применен к использованию расширенных моделей, оценка неопределенности с использованием этих моделей не включена в настоящие рекомендации.
Настоящие рекомендации применимы во всех областях измерений и испытаний, когда должна быть определена неопределенность результатов.
Настоящие рекомендации не описывают применение данных повторяемости в отсутствие данных воспроизводимости.
Настоящие рекомендации предполагают, что признанные значимыми систематические воздействия устранены или путем численной корректировки, включенной в метод измерений, или путем анализа и устранения причины воздействий.
Настоящие рекомендации содержат общее руководство. Представленный подход к оценке неопределенности применим для многих целей, однако возможно применение других подходящих методов.
В общем случае информация, приведенная в настоящих рекомендациях, относительно результатов, методов и процессов измерений относится также к результатам, методам и процессам испытаний.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ИСО Руководство 33:2000 Использование стандартных образцов
ИСО/МЭК Руководство 43-1:1997 Проверка компетентности путем межлабораторных сравнений. Часть 1. Разработка и применение программ проверок компетентности лабораторий
ИСО 3534-1:1993 Статистика. Словарь и условные обозначения. Часть 1. Вероятность и основные статистические термины
ИСО 5725-1:1994 Точность (правильность и прецизионность) методов и результатов измерений. Часть 1. Основные положения и определения
ИСО 5725-2:1994 Точность (правильность и прецизионность) методов и результатов измерений. Часть 2. Основной метод определения повторяемости и воспроизводимости стандартного метода измерений
ИСО 5725-3:1994 Точность (правильность и прецизионность) методов и результатов измерений. Часть 3. Промежуточные показатели прецизионности стандартного метода измерений
ИСО 5725-4:1994 Точность (правильность и прецизионность) методов и результатов измерений. Часть 4. Основные методы определения правильности стандартного метода измерений
ИСО 5725-5:1998 Точность (правильность и прецизионность) методов и результатов измерений. Часть 5. Альтернативные методы определения прецизионности стандартного метода измерений
ИСО 5725-6:1994 Точность (правильность и прецизионность) методов и результатов измерений. Часть 6. Использование значений точности на практике
ИСО/ТО 7871:1997 Контрольные карты кумулятивных сумм. Руководство по управлению качеством и анализу данных с помощью метода кумулятивных сумм
ИСО 8258:1991 Контрольные карты Шухарта
ИСО 10576-1:2003 Руководство по оценке соответствия установленным требованиям. Часть 1. Общие принципы
ИСО 11648-1:2003 Статистические аспекты выборочного контроля нештучной продукции. Часть 1. Общие принципы
3 Термины и определения
В настоящем стандарте применены термины по ИСО 5725-3, а также следующие термины с соответствующими определениями:
3.1 смещение (bias): Разность между математическим ожиданием результатов наблюдений* и принятым опорным значением.
________________
* Применительно к настоящим рекомендациям под наблюдениями следует понимать испытания и измерения.
Примечание - Смещение - общая систематическая ошибка* в противоположность случайной ошибке. Может быть один или более компонентов, образующих систематическую ошибку. Большее систематическое смещение от принятого значения соответствует большему значению смещения.
_______________
* Применительно к измерениям под ошибкой следует понимать "погрешность".
[ИСО 3534-1]
3.2 суммарная стандартная неопределенность (combined standard uncertainty) : Стандартная неопределенность результата измерений, полученного через значения нескольких других величин, равная положительному квадратному корню из суммы членов, представляющих собой дисперсии или ковариации этих других величин, взятых с весами, соответствующими степени влияния этих величин на результат измерений.
(GUM [1])
3.3 коэффициент охвата (coverage factor) : Числовой коэффициент, используемый как множитель суммарной стандартной неопределенности при определении расширенной неопределенности.
Примечание - Коэффициент охвата находится обычно в диапазоне от 2 до 3.
(GUM [1])
3.4 расширенная неопределенность (expanded uncertainty) : Величина, определяемая интервалом вокруг математического ожидания результатов измерений, охватывающим большую долю распределения значений, которые обоснованно могут быть приписаны измеряемой величине.
Примечания
1 Эта доля может быть определена через доверительную вероятность или уровень доверия интервала.
2 Чтобы связать определенный уровень доверия с интервалом расширенной неопределенности, необходимы предположения (в явной или неявной форме) о характере распределения вероятностей результатов измерений и их суммарной стандартной неопределенности. Уровень доверия, который соответствует этому интервалу, может соответствовать действительности только в той степени, в какой могут быть справедливы предположения.
3 Расширенную неопределенность называют полной неопределенностью в рекомендациях [2] INC-1 (1980).
[GUM [1]]
3.5 прецизионность (precision): Близость между независимыми результатами наблюдений, полученными при определенных принятых условиях.
Примечания
1 Прецизионность зависит от распределения случайных ошибок и не связана ни с истинным, ни с заданным значениями.
2 Меру прецизионности обычно выражают в терминах рассеяния и вычисляют как стандартное отклонение результатов наблюдений. Малой прецизионности соответствует большое стандартное отклонение.
3 Независимость результатов наблюдений означает, что результаты получены таким образом, что отсутствует влияние предыдущих результатов на том же самом или аналогичном объекте наблюдений. Количественные меры прецизионности решающим образом зависят от принятых условий. Условия повторяемости и условия воспроизводимости являются разными степенями принятых условий.
[ИСО 3534-1]
3.6 повторяемость (repeatability): Прецизионность в условиях повторяемости, то есть в условиях, когда независимые результаты наблюдений получены одним методом на идентичных объектах наблюдений в одной лаборатории одним и тем же оператором с использованием одного оборудования и за короткий интервал времени.
[ИСО 3534-1]
3.7 стандартное отклонение повторяемости (repeatability standard deviation): Стандартное отклонение результатов наблюдений, полученных в условиях повторяемости.
Примечания
1 Это мера рассеяния результатов наблюдений в условиях повторяемости.
2 Аналогично "дисперсию повторяемости" и "коэффициент вариации повторяемости" надо определять как меры рассеяния результатов наблюдений в условиях повторяемости.
[ИСО 3534-1]
3.8 воспроизводимость (reproducibility): Прецизионность в условиях воспроизводимости, то есть в условиях, когда результаты наблюдений получены одним методом на идентичных объектах наблюдений в различных лабораториях с разными операторами с использованием различного оборудования.
Примечание - Для обоснованного заявления воспроизводимости необходимые требования на изменения условий. Воспроизводимость представляют количественно через дисперсию результатов.
[ИСО 3534-1]
3.9 стандартное отклонение воспроизводимости (reproducibility standard deviation): Стандартное отклонение результатов наблюдений, полученных в условиях воспроизводимости.
Примечания
1 Это мера рассеяния распределения результатов наблюдений в условиях воспроизводимости.
2 Аналогично "дисперсию воспроизводимости" и "коэффициент вариации воспроизводимости" надо определять как меры рассеяния результатов наблюдений в условиях воспроизводимости.
[ИСО 3534-1]
3.10 стандартная неопределенность (standard uncertainty) : Неопределенность результатов измерений, выраженная в виде стандартного отклонения.
[GUM [1]]
3.11 правильность (trueness): Близость среднего значения, полученного на основании серии результатов наблюдений, к принятому опорному значению.
Примечание - Меру правильности обычно выражают в терминах смещения. Ссылка на правильность как "точность среднего" не рекомендуется.
[ИСО 3534-1]
3.12 неопределенность (измерения) (uncertainty): Параметр, связанный с результатом измерений, характеризующий рассеяние значений, которые обоснованно могут быть приписаны измеряемой величине.
Примечания
1 Параметром может быть, например, стандартное отклонение (или величина, кратная ему) или полуширина интервала, имеющего установленный уровень доверия.
2 Неопределенность измерений включает в себя в общем случае несколько составляющих. Некоторые из этих составляющих могут быть оценены по статистическим распределениям результатов серии измерений и охарактеризованы экспериментальным стандартным отклонением. Другие составляющие, которые также могут быть охарактеризованы стандартными отклонениями, оцениваются на основе предположений о распределении вероятностей, основанных на экспериментальной или другой информации.
3 Понятно, что результат измерений является лучшей оценкой измеряемой величины, а все составляющие неопределенности, включая те, которые являются результатом систематических воздействий, таких как поправки корректировки и эталоны, вносят свой вклад в рассеяние результатов.
[GUM [1]]
3.13 бюджет неопределенности (uncertainty budget): Список источников неопределенности с соответствующими им стандартными неопределенностями, собранный для определения суммарной стандартной неопределенности результата измерений.
Примечание - Список часто включает в себя дополнительную информацию, такую как коэффициент чувствительности (интенсивность изменения результатов в зависимости от величины воздействия на результат), степени свободы для каждой стандартной неопределенности и идентификацию средних, соответствующих каждой стандартной неопределенности, в терминах оценок типа А или типа В.
4 Обозначения
|
- коэффициент, указывающий отрезок, отсекаемый прямой на оси абсцисс в эмпирической функции ; |
|
- лабораторная составляющая смещения; |
|
- коэффициент наклона прямой в эмпирической функции ; |
|
- коэффициент в эмпирической функции ; |
|
- коэффициент чувствительности ; |
|
- коэффициент показателя степени в эмпирической функции ; |
|
- случайная погрешность результата измерений (остаточная ошибка); |
|
- случайная погрешность результата измерений (остаточная ошибка) в условиях повторяемости; |
|
- числовой коэффициент, используемый как множитель суммарной стандартной неопределенности при определении расширенной неопределенности ; |
|
- количество лабораторий; |
|
- среднее измеряемой величины; |
|
- количество составляющих, используемых в вычислениях неопределенности; |
|
- количество объединяемых составляющих при вычислении суммарной неопределенности в дополнение к совместно исследуемым данным; |
|
- количество повторений на одном уровне лабораторией ; |
|
- количество повторений измерения; |
|
- количество лабораторий; |
|
- количество объектов испытаний из большей (по количеству) партии; |
|
- количество назначенных величин в соответствии с соглашением в процесс совместных исследований; |
|
- коэффициент корреляции и (изменяется от -1 до +1); |
|
- стандартное отклонение, представляющее межгрупповую составляющую дисперсии; |
|
- межгрупповая составляющая дисперсии; |
|
- оценочное или экспериментальное стандартное отклонение результатов наблюдений, полученных повторными измерениями на образце сравнения, используемом при контроле смещения; |
|
- стандартное отклонение повторяемости с степенями свободы; |
|
- неопределенность, соответствующая неоднородности образца; |
|
- составляющая дисперсии, соответствующая неоднородности образца; |
|
- экспериментальное или оценочное межлабораторное стандартное отклонение; |
|
- скорректированная неопределенность, соответствующая , когда вклад зависит от выходной переменной; |
|
- оцениваемая дисперсия ; |
|
- внутрилабораторное стандартное отклонение; |
|
- скорректированная оценка внутрилабораторного стандартного отклонения, когда вклад зависит от выходной переменной; |
|
- оцениваемая дисперсия ; |
|
- оцениваемое стандартное отклонение воспроизводимости; |
|
- скорректированная оценка стандартного отклонения воспроизводимости; |
- скорректированное стандартное отклонение воспроизводимости, вычисленное по эмпирической модели, когда вклады зависят от выходной переменной; | |
- внутрилабораторное стандартное отклонение, полученное из повторных измерений или других повторных исследований; | |
- внутригрупповая составляющая дисперсии (часто внутрилабораторная составляющая дисперсии); | |
- лабораторное стандартное отклонение разностей при сравнении обычного метода с точным методом; | |
|
- -е исходное значение при определении результата; |
|
- отклонение -го исходного значения от номинального значения ; |
|
- -e исходное значение при определении результата; |
- неопределенность, соответствующая , вызванная неопределенностью оценки , по измерениям исходного эталона или сравнения образца с сертифицированным значением ; | |
|
- неопределенность, соответствующая сертифицированному значению ; |
- суммарная стандартная неопределенность, соответствующая ; | |
|
- суммарная неопределенность для результата ; |
|
- суммарная стандартная неопределенность, соответствующая , выраженная через дисперсию*; |
________________ | |
|
- неопределенность, соответствующая неоднородности выборки; |
|
- расширенная неопределенность, равная стандартной неопределенности , умноженной на ; |
|
- расширенная неопределенность , когда ( - коэффициент охвата); |
|
- результат испытаний -го объекта точного метода при сравнении методов; |
|
- результат испытаний -го объекта от обычного метода испытаний при сравнении методов; |
|
- заданное значение для проверки квалификации; |
|
- лабораторное смещение; |
|
- оценка смещения -й лаборатории, равная среднему лаборатории , минус сертифицированное значение ; |
|
- среднее смещение лаборатории при сравнении обычного метода с фиксированным; |
|
- смещение, соответствующее используемому методу измерений; |
|
- оцененное или измеренное смещение; |
- неизвестное математическое ожидание результата*; | |
________________ * В соответствии с ГОСТ Р ИСО 5225.1 -истинное или принятое опорное значение измеряемой величины. | |
|
- сертифицированное значение образца сравнения; |
|
- стандартное отклонение при проверке квалификации; |
- истинное значение стандартного отклонения результатов, полученных повторными измерениями на образце сравнения, используемом для контроля смещения; | |
|
- межлабораторное стандартное отклонение; стандартное отклонение ; |
|
- дисперсия ; межлабораторная дисперсия; |
|
- внутрилабораторное стандартное отклонение; стандартное отклонение ; |
|
- дисперсия ; внутрилабораторная дисперсия; |
|
- стандартное отклонение внутри группы; |
- стандартное отклонение, требуемое для адекватной работы ИСО Руководство 33; | |
- эффективная степень свободы для стандартного отклонения или неопределенности, соответствующей входному значению ; | |
- число степеней свободы. |
5 Принципы
5.1 Отдельные результаты и свойства процесса измерений
5.1.1 Неопределенность измерений относят к отдельным результатам измерений. Повторяемость, воспроизводимость и правильность, напротив, относят к выполнению процесса измерений или испытаний. Для анализа в соответствии со всеми частями ИСО 5725 процесс измерений или испытаний является единым методом измерений, используемым всеми лабораториями, принимающими участие в исследовании. Следует заметить, что в настоящих рекомендациях под методом измерений понимают единственную детальную процедуру (как определено в Международном словаре основных и общих терминов в метрологии (VIM) [2]). Неявно в настоящих рекомендациях предполагается, что графики, отражающие выполнение процесса, полученные при исследовании метода, соответствуют всем отдельным результатам измерений, полученным с помощью процесса. Это предположение требует подтверждающих доказательств в виде данных соответствующего контроля качества и уверенности в качестве процесса измерений (раздел 7).
5.1.2 Ниже будет показано, что дополнительно может потребоваться учитывать различия между отдельными объектами испытаний. Однако в этом случае не нужно предпринимать индивидуальные и детальные исследования неопределенности для каждого объекта испытаний при наличии хорошо охарактеризованного и устойчивого процесса измерений.
5.2 Применение данных воспроизводимости
Применение данного документа основано на двух принципах:
- стандартное отклонение воспроизводимости, полученное при совместных исследованиях, является правомерной основой для оценки неопределенности измерений (см. 2.1);
- воздействия, не наблюдаемые в процессе совместных исследований, должны быть незначительными или явно учитываться. Последний принцип является расширением основной модели, используемой для совместных исследований (см. А.2.3).
5.3. Основные уравнения статистической модели
5.3.1 Статистическая модель, на которой основано данное руководство, сформулирована в виде уравнения:
, (1)
где - наблюдаемый результат, рассчитываемый по уравнению: ;
- неизвестное математическое ожидание;
- смещение, присущее методу измерений;
- лабораторная составляющая смещения;
- отклонение от номинального значения ;
- коэффициент чувствительности, равный ;
- остаточная ошибка.
Предполагается, что и подчиняются нормальному распределению с нулевым средним и дисперсиями и соответственно. Эти предположения формируют модель, используемую в ИСО 5725-2 для анализа совместных данных.
Так как наблюдаемые стандартные отклонения смещения метода , лабораторные смещения и остаточные ошибки являются полными мерами разброса в условиях совместного исследования, сумма учитывает воздействия, которые вызывают отклонения, не включенные в , или , и, таким образом, эта сумма позволяет учесть влияние действий, которые не выполнялись в ходе совместных исследований.
Примерами таких действий являются следующие:
a) подготовка объекта испытаний, выполняемая практически для каждого испытываемого объекта, но выполненная до совместных исследований;
b) влияние подвыборки в случае, когда объекты, подвергаемые совместному исследованию, были гармонизированы до исследования. Предполагается, что подчиняются нормальному распределению с нулевым математическим ожиданием и дисперсией .
Пояснения для этой модели приведены в приложении А.
Примечание - Ошибка обычно определяется как разность между установленным значением и результатом измерений. В GUM [1] "ошибку" четко отличают от "неопределенности" (разброса значений). При оценке неопределенности, однако, важно характеризовать разброс значений, вызванный случайными воздействиями, и включать его в модель. Для представленных целей это достигается включением члена, характеризующего "ошибку" с нулевым математическим ожиданием, как в уравнении (1).
5.3.2 Учитывая модель, описываемую уравнением (1), неопределенность , связанную с наблюдениями, можно оценить, применяя уравнение:
, (2)
где - оценка дисперсии ;
- оценка дисперсии ;
- неопределенность, вызванная неопределенностью оценки , полученной на основе измерений исходного эталона или образца сравнения с сертифицированным значением ;
- неопределенность, связанная с .
Учитывая, что стандартное отклонение воспроизводимости , задаваемое равенством , можно заменить на , уравнение (2) можно привести к уравнению
. (3)
5.4 Данные повторяемости
Данные повторяемости используют в настоящих рекомендациям прежде всего для проверки прецизионности, которая в соединении с другими тестами подтверждает, что конкретная лаборатория может применять данные воспроизводимости математического ожидания и правильности при оценке неопределенности. Данные повторяемости используют также при вычислении составляющей воспроизводимости в неопределенности (см. 7.3 и 11).
6 Оценка неопределенности с использованием оценок повторяемости, воспроизводимости и правильности
6.1 Процедура оценки неопределенности измерений
Принципы, на которых основаны настоящие рекомендации (см. 5.1), приводят к следующей процедуре оценки неопределенности измерений:
a) получение оценок повторяемости, воспроизводимости и правильности метода на основе опубликованной информации о методе;
b) проверка, не превышает ли лабораторное смещение, рассчитанное по измерениям на основе данных, полученных в соответствии с перечислением а);
c) проверка, не превышает ли прецизионность, полученная по текущим измерениям прецизионности, полученной на основе оценок повторяемости и воспроизводимости в соответствии с перечислением а);
d) идентификация любых воздействий на измерение, которые не были учтены в процессе исследований в соответствии с перечислением а), и определение количественной оценки отклонения, которое может вызывать эти воздействия, учитывая коэффициент чувствительности и неопределенности каждого воздействия;
e) объединение оценки воспроизводимости (перечисление а)) с неопределенностью соответствующей правильности (перечисления а) и b)) и результатами дополнительных воздействий (перечисление d)) для формирования оценки суммарной неопределенности, когда смещение и прецизионность находятся под контролем в соответствии с перечислениями b) и с).
Этапы этой процедуры описаны более подробно в разделах 7-11.
Примечание - В рекомендациях предполагается, что в случае, когда смещение является неконтролируемым, выполняют корректирующие действия, чтобы привести процесс в управляющую зону.
6.2 Различия между фактической прецизионностью и ее математическим ожиданием
Если фактическая прецизионность отличается от математического ожидания прецизионности, полученного на основе исследований в соответствии с перечислением а), соответствующие вклады в неопределенность должны быть учтены. В 8.5 описаны регуляторы оценок воспроизводимости для общего случая, когда прецизионность приближенно пропорциональна уровню отклика.
7 Установление соответствия данных выполнения метода результатам измерений для конкретного процесса измерений
7.1 Общие положения
Результатами совместного исследования являются , и, в некоторых случаях, оценка смещения метода, которые формируют требования для выполнения метода. При принятии метода для применения ожидается, что лаборатория продемонстрирует, что она выполняет эти требования. В большинстве случаев это достигается исследованиями, направленными на подтверждение контроля повторяемости (см. 7.3) и лабораторной составляющей смещения (см. 7.2), и постоянными проверками выполнения метода (контроль и обеспечение качества (см. 7.4)).
7.2 Демонстрация контролируемости лабораторной составляющей смещения
7.2.1 Общие требования
7.2.1.1 Лаборатория должна продемонстрировать, что ее смещение при выполнении метода находится под контролем, то есть лабораторная составляющая смещения не выходит за пределы смещения, полученного из совместных исследований. В следующих описаниях предполагается, что контроль смещения выполнен на материалах значениями, близкими к объектам исследования при обычных испытаниях. В тех случаях, когда материалы, используемые для проверки смещения, не имеют значений, близких к материалам, исследуемым при обычных испытаниях, итоговые вклады в неопределенность должны быть исправлены в соответствии с условиями 8.4 и 8.5.
7.2.1.2 В общем случае проверка лабораторной составляющей смещения сводится к сравнению лабораторных результатов с некоторыми эталонными значениями и представляет собой оценку . Уравнение (2) показывает, что неопределенность, связанная с изменениями , характеризуется , непосредственно входящей в . Однако, поскольку проверка смещения имеет собственную неопределенность, неопределенность сравнения в принципе увеличивает неопределенность результатов, получаемых при будущих применениях метода. По этой причине важно гарантировать, что неопределенность, связанная с проверкой смещения, мала по сравнению с (в идеале меньше, чем 0,2) и, следовательно, соответствующее увеличение неопределенности является незначительным. В этом случае, если свидетельства чрезмерной лабораторной составляющей смещения не обнаружены, уравнение (3) применяют без изменений. Если неопределенность, связанная с проверкой смещения, является большой, благоразумно увеличивать неопределенность, оцененную на основе уравнения (3) (см. 3.13). Если на основе совместных исследований правильности известно, что метод имеет незначительное смещение, известное смещение метода следует учитывать при оценке лабораторного смещения, например, путем исправления результатов на известное смещение метода.
7.2.2 Методы демонстрации контролируемости лабораторной составляющей смещения
7.2.2.1 Общие положения
Контролируемость смещения может быть продемонстрирована одним из следующих методов. Последовательно одни и те же общие критерии используются для всех тестов на смещение, приведенных в настоящих рекомендациях. Допускается использовать более строгие тесты и проверки.
7.2.2.2 Исследование образца сравнения или эталона стандартного метода измерений
Лаборатория должна исполнить повторных измерений на исходном эталоне в условиях повторяемости, чтобы получить оценку смещения на этом веществе (равную среднему лаборатории минус стандартное значение ). При этом следует выбирать так, чтобы неопределенность удовлетворяла неравенству . Следует заметить, что исходный эталон в общем случае не является тем же эталоном, который использовали при оценке правильности метода. Кроме того, вообще не равно . Следуя Руководству ИСО/МЭК 33 (с соответствующим изменением обозначений), процесс измерений выполняется адекватно, если
. (4)
Заменив на его приближение в уравнении (4), получаем уравнение:
, (5)
где - количество повторений лаборатории ;
- внутрилабораторное стандартное отклонение, полученное на основе повторений или других исследований повторяемости;
- межлабораторное стандартное отклонение.
Соответствие критерию, описываемому уравнением (4), является подтверждением того, что лабораторная составляющая смещения находится в интервале значений, установленном при совместных исследованиях. Следует обратить внимание на то, что образец сравнения или эталон используют здесь для независимой проверки или в качестве контрольного вещества, а не для калибровки.
Примечания
1 Лаборатория может применять более строгий критерий, чем уравнение (4), используя коэффициент охвата менее 2 или выполняя альтернативный и более чувствительный тест на смещение.
2 Эти процедуры предполагают, что неопределенность, связанная с эталонным значением, мала по сравнению с .
7.2.2.3 Сравнения с заданным методом испытаний, обладающим известной неопределенностью
Лаборатория должна проверить соответствующее количество объектов испытаний, применяя заданный метод испытаний и метод, использованный лабораторией, получив, таким образом, пар (, ) ( - результат применения заданного метода к -му объекту, а - значение, полученное применением обычного метода испытаний для -го объекта). Затем лаборатория должна вычислять соответствующее среднее смещение , используя уравнение (6) и стандартное отклонение разностей:
. (6)
На практике значение должно быть выбрано так, чтобы неопределенность удовлетворяла неравенству . По аналогии с уравнениями (4) и (5) процесс измерений удовлетворяет требованиям, если . В этом случае уравнение (3) используют без изменений.
Примечания
1 Лаборатория может выбирать более строгий критерий, чем уравнение (4), используя коэффициент охвата менее 2 или выполняя альтернативный и более чувствительный тест на смещение.
2 Эти процедуры предполагают, что неопределенность, связанная с эталонным методом, мала по сравнению с .
7.2.2.4 Сравнение с другими лабораториями при использовании того же метода
Если лаборатория участвует в дополнительных совместных исследованиях (например, при проверке квалификации в соответствии с ИСО/МЭК Руководство 43-1), для которых она может оценивать смещение, эти данные можно использовать для контроля смещения. Есть два возможных варианта:
a) при выполнении испытаний используют эталон или образец сравнения с независимо назначенными значениями неопределенности. Затем применяют процедуру 7.2.2.2 без изменений;
b) проводят проверку соответствия заданных значений , , ..., . Лаборатории, чьи результаты представлены значениями , , ..., , следует рассчитать свое среднее смещение в соответствии с уравнением (7) и стандартное отклонение заданных значений.
. (7)
Процесс измерений удовлетворяет требованиям, если . В этом случае уравнение (3) используют без изменений.
Примечания
1 Эта процедура предполагает, что заданные значения основаны на количестве результатов, превышающем , и обладают незначительной неопределенностью.
2 В некоторых схемах проверки квалификации все значения преобразуют в -множество вычитанием заданного значения и делением на стандартное отклонение (см. ИСО/МЭК Руководство 43-1). Если стандартное отклонение метода менее или равно , среднее -множества лежит между для назначенного значения . Это является достаточным свидетельством контролируемости смещения.
7.2.3 Выявление существенной лабораторной составляющей смещения
Как отмечено в разделе 1, настоящие рекомендации применимы только в тех случаях, когда лабораторная составляющая смещения находится под контролем. Если обнаружено чрезмерное смещение, предполагается, что будут предприняты действия для приведения смещения в границы требуемого диапазона до продолжения измерений. Такие действия обычно требуют проведения исследований и устранения причины смещения.
7.3 Верификация повторяемости
7.3.1 Испытательная лаборатория должна продемонстрировать, что ее повторяемость совместима со стандартным отклонением повторяемости, полученным при совместных исследованиях. Демонстрация достигается проведением анализа одного или более подходящих испытываемых материалов для получения (объединяя результаты при необходимости) стандартного отклонения повторяемости с степенями свободы. Значения необходимо сравнивать, используя F-тест с 95%-ным уровнем доверия, со стандартным отклонением повторяемости , полученным при совместных исследованиях. На практике для получения 15 следует выполнять достаточно повторений.
7.3.2 Если значительно больше , лаборатория должна или идентифицировать и устранять соответствующие причины, или использовать вместо во всех оценках неопределенности, рассчитанных с использованием настоящих рекомендаций. Следует обратить внимание, что это вызывает увеличение оценки стандартного отклонения повторяемости , так как будет заменено на ( является скорректированной оценкой стандартного отклонения воспроизводимости). Наоборот, если значительно меньше , лаборатория может также использовать вместо , получая меньшую оценку неопределенности.
Во всех исследованиях прецизионности важно подтверждать, что данные свободны от неизвестных смещений, и проверять постоянство стандартного отклонения для различных объектов испытаний. Если стандартное отклонение непостоянно, может быть полезно оценить прецизионность отдельно для каждого различного класса объектов или построить общую модель (см. 8.5) для этой зависимости.
Примечание - Если требуется сравнение с заданным значением прецизионности, Руководство ИСО 33 более детально описывает соответствующий тест, основанный на . Здесь соответствует требуемому значению прецизионности.
7.4 Постоянная верификация
Кроме предварительной оценки смещения и прецизионности, лаборатория должна принимать должные меры для гарантии того, что процедура измерений остается в состоянии статистического контроля. В частности, это включает следующее:
- соответствующий контроль качества, включая регулярные проверки смещения и прецизионности. Для этих проверок допускается использовать любые уместные устойчивые гомогенные объекты испытаний или материалы. Настоятельно рекомендуется использование контрольных карт (см. ИСО/ТО 7871 и ИСО 8258);
- меры по проверке качества, включая использование соответственно обученного и квалифицированного персонала, работающего в соответствующей системе качества.
8 Учет особенностей объекта испытаний
8.1 Общие положения
В совместных исследованиях или оценке промежуточных показателей прецизионности в соответствии с ИСО 5725-2 и ИСО 5725-3 обычно проводят измерения на гомогенных материалах или объектах небольшого количества типов. Это является обычной практикой для разделения подготовленных материалов. Однако объекты испытаний могут изменяться в широком диапазоне, что может требовать дополнительной обработки до испытаний. Например, образцы для экологических испытаний часто поставляют высушенными и гомогенизированными. Обычные образцы, как правило, являются влажными, неоднородными и грубо разделенными. Соответственно необходимо исследовать и, если необходимо, учитывать эти различия.
8.2 Отбор выборки
8.2.1 Процесс отбора выборки
Совместные исследования редко включают в себя этап отбора выборки. Если метод, использованный внутри лаборатории, включает в себя подвыборки или процедура оценивает свойство большого объема материала по маленькому образцу, то влияние отбора выборки необходимо исследовать. Может быть полезно обращаться к документации по отбору выборки, например к ИСО 11648-1 или другим стандартам.
8.2.2 Негомогенность
Негомогенность обычно исследуют экспериментально с применением дисперсионного анализа (ANOVA)* к нескольким объектам испытаний, для которых составляющая дисперсии , описывающая разброс между объектами, характеризует негомогенность. Если после всех установленных действий по гомогенизации испытываемые материалы признаны существенно неоднородными, эту оценку дисперсии следует преобразовать непосредственно в стандартную неопределенность (то есть ). В некоторых обстоятельствах, особенно когда стандартное отклонение негомогенности найдено для выборки из объектов, взятой из партии, а средний результат будет применим к другим объектам партии, вклад неопределенности оценивают на основе предикционного интервала (то есть ). Можно также теоретически оценивать воздействие негомогенности, используя знание процесса отбора выборки и предположений о распределении, соответствующем выборке.
__________________
* Принятая в международной практике аббревиатура для обозначения дисперсионного анализа (Analysis of Variance).
8.3 Подготовка и предварительная обработка выборки
В большинстве исследований образцы являются гомогенными и могут быть дополнительно стабилизированы до распределения. Могут потребоваться исследования, позволяющие учитывать воздействия специфических процедур предварительной обработки внутри лаборатории. Как правило, такие исследования устанавливают воздействие этой процедуры на результаты измерений на исследуемых материалах с приблизительно или точно установленными свойствами. Воздействием может быть изменение разброса или систематических воздействий. Существенные изменения разброса следует устранять прибавлением соответствующей составляющей к бюджету неопределенности (предполагая, что воздействия увеличивают разброс). Если выявлены существенные систематические воздействия, наиболее удобно устанавливать соответствующий верхний предел. Следуя рекомендациям GUM [1], этот предел можно рассматривать как границу прямоугольного или другого ограниченного симметричного распределения, а оценку стандартной неопределенности можно задавать в виде полуширины области изменений функции распределения, деленной на соответствующий коэффициент.
8.4 Изменение типа объекта испытаний
При необходимости следует исследовать неопределенность, являющуюся результатом изменения типа или состава объектов испытаний по сравнению с используемыми в совместных исследованиях. Как правило, подобные воздействия должны быть предсказаны на основе установленных воздействий, объемных свойств материала (которые дают оценку неопределенности, полученную в соответствии с GUM [1]) или исследованы введением систематических или случайных изменений типа или состава объектов испытаний (см. приложение В).
8.5 Изменение неопределенности в зависимости от уровня отклика
8.5.1 Корректировка
Обычно некоторые или большая часть составляющих неопределенности измерений зависят от измеренного значения. ИСО 5725-2 рассматривает три простых случая, когда стандартное отклонение воспроизводимости для положительной величины приближенно описывается одной из моделей
; (8)
; (9)
, (10)
где - откорректированная оценка стандартного отклонения воспроизводимости, рассчитанная по приближенной модели;
, , и - эмпирические коэффициенты, полученные на основе пяти или большего количества различных объектов испытаний с различными средними отклика (, и являются положительными).
При использовании уравнений (8)-(10) неопределенность должна основываться на оценке воспроизводимости, рассчитанной с использованием соответствующей модели.
В условиях 7.3 должен учитывать член , отражающий вклад повторяемости. Для большинства целей имеет место простое пропорциональное изменение .
, (11)
где имеет то же самое значение, как и в 7.3.
8.5.2 Изменение других вкладов в неопределенность
В общем случае, если любая составляющая неопределенности изменяется в соответствии с измеренным откликом предсказуемым способом, соответствующая стандартная неопределенность должна быть откорректирована соответственно.
Примечание - Если вклады в неопределенность прямо пропорциональны , часто бывает удобно выражать все существенные воздействия в терминах мультипликативных воздействий на , а всю неопределенность - в форме относительных стандартных отклонений.
9 Дополнительные факторы
Раздел 8 рассматривает главные факторы, которые обычно различаются в совместных исследованиях и обычных испытаниях. Возможно, что в специфических случаях могут проявляться другие воздействия. Это может быть вызвано тем, что контролируемые переменные случайно или преднамеренно были постоянными в течение совместного исследования, или тем, что полный диапазон условий, достижимых в обычной практике, не был охвачен при совместных исследованиях.
Воздействия факторов, которые считаются постоянными или которые изменяются недостаточно при совместных исследованиях, следует оценивать отдельно либо в процессе экспериментального изменения, либо в соответствии с прогнозом на основе теории. В тех случаях, когда воздействия являются существенными, неопределенность, связанную с соответствующими факторами, необходимо оценивать, регистрировать и объединять с другими вкладами обычным способом (то есть суммировать в соответствии с уравнением (3)).
10 Общее выражение для суммарной стандартной неопределенности
Уравнение (3), при необходимости использовать скорректированную оценку вместо , для учета факторов, рассматриваемых в разделе 8, приводит к общему выражению (12) для оценки суммарной стандартной неопределенности соответствующему результату .
. (12)
Значение подсчитывают в соответствии с уравнением (13), см. также уравнение (А.8).
, (13)
где - количество лабораторий;
- количество повторений в каждой лаборатории.
Переменная не использована в уравнении (12), потому что неопределенность , соответствующая , уже включена . Индекс охватывает воздействия, идентифицированные в разделах 8 и 9 (индексы изменяются от 1 до ). Очевидно, что если воздействия и их неопределенности малы по сравнению с , то ими можно пренебречь для большинства практических целей. Например, неопределенность менее 0,2 ведет к изменению менее чем на 0,02 оценки полной неопределенности.
11 Бюджет неопределенности, основанный на данных совместных исследований
Настоящие рекомендации используют только одну приведенную в уравнении (3) модель для описания результатов измерений или испытаний. Информацию, подтверждающую справедливость модели, можно получать из различных источников, но если неопределенность, соответствующая испытаниям, остается незначительной, используют уравнение (3). Однако есть несколько различных ситуаций, при которых уравнение (3) немного изменяется. Например, если параметры воспроизводимости или повторяемости зависят от отклика. Бюджет неопределенности, если неопределенность совсем не зависит от отклика в исследуемом диапазоне, приведен в таблице 1, а для случая, когда неопределенность зависит от отклика, - в таблице 2.
Таблица 1 - Составляющие неопределенности, не зависящие от отклика
Источник воздействия |
Стандартная неопределенность, соответствующая |
Комментарий |
Используют, если смещение, выявленное при совместных исследованиях, устранено, а неопределенность является существенной | ||
См. таблицу 2 | ||
Если среднее, полученное по полных повторений метода, применяют к объекту испытаний, неопределенность, соответствующая , принимает вид - | ||
См. раздел 8 и приложение В | ||
Стандартная неопределенность измеряется в тех же единицах, что и . |
Таблица 2 - Составляющие неопределенности, зависящие от отклика
Источник воздействия |
Стандартная неопределенность, соответствующая |
Комментарий |
Используют, только если выявленное при совместном исследовании смещение устранено, а неопределенность является существенной. | ||
и - коэффициенты предполагаемой линейной зависимости между и средним откликом , аналогичной уравнению (9). Эта форма применима, только если установлена зависимость от . В противном случае используют комбинированную оценку, соответствующую и таблицы 1 | ||
и - коэффициенты предполагаемой линейной зависимости между и средним откликом , аналогичной уравнению (9). | ||
, |
|
и - коэффициенты линейных отношений между и средним откликом , как определено в уравнениях (9) и (10). |
См. раздел 8 и приложение В | ||
Стандартную неопределенность измеряют в тех же единицах, что и . |
12 Оценка неопределенности комбинированного результата
12.1 Комбинированный результат формируют из совокупности результатов различных испытаний, каждый из которых охарактеризован совместными исследованиями. Например, вычисления по определению состава мяса обычно объединяют определением содержания белка (рассчитанного путем определения содержания азота), жира и влаги. При этом содержание каждого вещества определяют соответствующим стандартным методом.
12.2 Неопределенность для каждого результата может быть получена на основе принципов, приведенных в настоящих рекомендациях, или непосредственно используя уравнения (1) или (2) соответственно. Если величины независимы, суммарную неопределенность для результата вычисляют по формуле
. (14)
Если не являются независимыми, должны быть сделаны предположения относительно корреляции в соответствии с GUM [1] (также используют уравнение (А.2)).
13 Представление информации о неопределенности
13.1 Общие положения
Неопределенность может быть представлена в виде суммарной стандартной неопределенности или суммарной расширенной неопределенности ( - коэффициент охвата) (см. 13.2 и GUM [1]). Может быть удобно представить неопределенность в относительных величинах как коэффициент вариации или расширенную неопределенность, выражаемые в процентах зарегистрированных результатов.
13.2 Выбор коэффициента охвата
13.2.1 Общие положения
При оценке суммарной расширенной неопределенности применяют следующие исследования для выбора коэффициента охвата .
13.2.2 Уровень доверия
Для практических целей должно быть указано значение суммарной расширенной неопределенности, соответствующее уровню доверия 95%. Однако выбор уровня доверия зависит от диапазона факторов, таких как критичность и последствия применения неправильных результатов. Эти факторы вместе с любыми рекомендациями или юридическими требованиями, касающимися применения, должны быть рассмотрены при выборе .
13.2.3 Степени свободы, соответствующие оценке
13.2.3.1 Для большинства практических целей, когда требуется 95%-ный уровень доверия и число степеней свободы в доминирующих составляющих неопределенности превышает 10 (>10), выбор 2 обеспечивает достаточно надежный охват вероятного диапазона значений. Однако есть обстоятельства, в которых это приводит к существенной недооценке, особенно когда один или более значимых членов уравнения (12) имеют число степеней свободы менее 7.
13.2.3.2 Если один такой член с степенями свободы доминирует [признаком является выполнение неравенства ], обычно достаточно взять в качестве эффективные степени свободы , соответствующие .
13.2.3.3 Если несколько существенных членов имеют приблизительно равную величину и степени свободы, удовлетворяющие условию 10, для получения эффективных значений числа степеней свободы следует применять уравнение Велча-Саттервейта (уравнение (15))
. (15)
Значение тогда выбирают из , используя значение квантиля двустороннего распределения Стьюдента для требуемого уровня доверия и степеней свободы. Это наиболее безопасно при округлении нецелых чисел до ближайшего меньшего целого числа.
Примечание - Во многих областях измерений и испытаний для нормального распределения частота статистических выбросов является достаточно высокой, поэтому применение высоких уровней доверия (>95%) без хорошего знания распределения не рекомендуется.
14 Сравнение данных выполнения метода и неопределенности
14.1 Основные предположения
Оценка неопределенности измерений в соответствии с настоящими рекомендациями обеспечивает стандартную неопределенность, которая, хотя и основывается прежде всего на оценках воспроизводимости или промежуточной прецизионности, отдает должное факторам, которые не изменяются в процессе исследований, в которых эти оценки прецизионности получены. В принципе итоговая стандартная неопределенность должна быть идентична неопределенности, полученной на основе детальной математической модели процесса измерений. Сравнение этих двух оценок, если это возможно, обеспечивает полезную проверку качества оценки. Рекомендованная процедура описана в 14.2.
Процедура основана на двух важных предположениях:
- во-первых, оценку стандартной неопределенности c эффективными степенями свободы обычно определяют в предположении о нормальном распределении наблюдений (это означает, что ) подчиняется распределению с степенями свободы). Это предположение позволяет использовать F-критерий. Однако, поскольку суммарная неопределенность может включать неопределенность, связанную с величинами, описываемыми распределениями различной формы с различными дисперсиями, результаты испытаний необходимо рассматривать как индикатор, а уровень доверия следует выбирать с необходимой осторожностью;
- во-вторых, обычно предполагают, что две оценки неопределенности, которые будут сравниваться, полностью независимы. Это также маловероятно на практике, так как некоторые факторы могут быть общими для обеих оценок. Более тонкие воздействия являются предметом исследований для выявления влияния составляющей неопределенности, соответствующей выполнению работ в разных лабораториях. Предполагается, что приняты необходимые меры предосторожности, чтобы избежать этого воздействия. Если значимые факторы являются общими для обеих оценок неопределенности, очевидно, что оценки будут подобны значительно чаще. В этом случае, если последовательные испытания не в состоянии выявлять существенные различия, результаты не следует трактовать как свидетельство надежности модели измерений.
14.2 Процедура сравнения
Для сравнения двух оценок и является большей из них) с эффективными степенями свободы и соответственно, используя уровень доверия (например, для 95%-ного уровня доверия 0,05), необходимо выполнить следующие действия:
вычислить ;
найти по таблицам или получить с помощью программного обеспечения одностороннее верхнее критическое значение . Если даны верхнее и нижнее значения, выбирают верхнее значение, которое всегда больше 1;
если , то следует считать значительно больше, чем .
14.3 Причины различий
Существует много причин для существенного различия между суммарными оценками неопределенности. Они включают в себя следующее:
- подлинные различия в работе лабораторий;
- неудачную модель, не учитывающую влияние всех существенных воздействий на измерения;
- неверную оценку значимого вклада в неопределенность.
Приложение А
(справочное)
Подходы к оценке неопределенности
А.1 Подход GUM
Руководство по оценке неопределенности измерений (GUM [1]), изданное ИСО, устанавливает методологию оценки неопределенности измерений, связанную с результатом в соответствии с моделью процесса измерений. Методология GUM базируется на рекомендациях Международной палаты мер и весов (BIPM) [3], которые признают, что составляющие неопределенности можно оценивать либо на основе статистического анализа серии наблюдений (оценка типа А), либо другими средствами (оценка типа В), например, используя данные публикаций о неопределенности образцов сравнения или эталонов или, при необходимости, мнения специалистов. Отдельные составляющие выражают в виде стандартных отклонений и, при необходимости, затем объединяют.
Выполнение рекомендаций BIPM [3] в GUM [1] начинается с модели измерений в виде функции , связывающей результат измерений со входными величинами . Тогда в случае независимых входных величин GUM дает неопределенность в соответствии с уравнением (А.1):
, (А.1)
где - коэффициент чувствительности, оцениваемый в соответствии с уравнением (частная производная по );
и - стандартные неопределенности, то есть неопределенности измерений, выраженные в виде стандартных отклонений.
Если переменные не являются независимыми, выражение для неопределенности является более сложным и определяется уравнением:
, (А.2)
где - ковариация между и ;
и - коэффициенты чувствительности, соответствующие уравнению (А.1). На практике часто ковариацию выражают через коэффициент корреляции :
, (A.3)
где - 11.
В случаях, учитывающих нелинейность модели измерений, уравнение (А.1) расширяют, включая члены более высокого порядка. Эта ситуация более подробно описана в GUM [1]. После вычисления комбинированной стандартной неопределенности с использованием уравнений (А.1)-(A.3) расширенную неопределенность определяют, умножая на коэффициент охвата , который выбирают на основе числа степеней свободы для . Более подробно это описано в разделе 13.
В подходе GUM существует неявное предположение, что входные данные измерены или назначены. Если возникают воздействия, которые могут быть не определены через измеримые величины (например, воздействие оператора), удобно сформировать суммарную стандартную неопределенность , которая учитывает такие воздействия, или ввести дополнительные переменные в .
Из-за ориентации на входные величины этот подход иногда называют восходящим походом оценки неопределенности.
Физическая интерпретация не является однозначной, так как она может включать члены, полученные на основе экспертной оценки, и таким образом лучше всего рассматривать как функцию, характеризующую степень доверия. Однако можно получить более прямую физическую интерпретацию, определив разброс результатов вычисления , который был бы получен, если бы все входные переменные изменялись случайным образом в соответствии с принятым для них распределением.
A.2 Принцип совместных исследований
А.2.1 Основная модель
Планирование эксперимента при совместных исследованиях, их организация и статистическая обработка подробно описаны в ИСО 5725-1 - ИСО 5725-6. Самая простая модель, лежащая в основе статистической обработки данных совместных исследований, задается уравнением:
, (А.4)
где - математическое ожидание ;
- лабораторная составляющая смещения в условиях повторяемости и предположения о нормальном распределении со средним 0 и стандартным отклонением ;
- случайная ошибка в условиях повторяемости и предположения о нормальном распределении со средним 0 и стандартным отклонением .
Кроме того, предполагается, что и , некоррелированы.
Применение уравнения (А.1) к этой простой модели с учетом того, что определяется через стандартное отклонение повторяемости , полученное при межлабораторном исследовании, приводит к уравнению (А.5) для единственного результата и уравнению (А.6) для суммарной стандартной неопределенности результата :
и , (A.5)
. (A.6)
По сравнению с ИСО 5725-2 уравнение (A.6) представляет собой лишь оценку стандартного отклонения воспроизводимости .
Так как этот подход ориентируется на полное выполнение метода, его называют иногда нисходящим подходом.
Следует учитывать, что каждая лаборатория вычисляет свою оценку по уравнению , предполагая ее наилучшей оценкой измеряемой величины для лаборатории. Тогда, если - общая модель, используемая для описания поведения измерительной системы, то, следовательно, при вычислении предполагается, что дисперсии, характеризующиеся оценками и , являются результатом изменения величин ,..., . Если предполагается, что условия воспроизводимости обеспечиваются для случайной величины при всех существенных воздействиях и применяется физическая интерпретация , приведенная выше, то из этого следует, что в уравнении (A.6) является оценкой , описанной уравнениями (А.1) или (А.2).
Первый принцип, на котором основаны настоящие рекомендации, состоит в том, что стандартное отклонение воспроизводимости, полученное в совместном исследовании, является основой для оценки неопределенности измерений.
А.2.2 Включение данных правильности
Правильность в общем случае измеряется смещением относительно принятого опорного значения. В некоторых совместных исследованиях правильность метода в конкретной системе измерений (обычно СИ) исследуют путем анализа образца сравнения (CRM) или эталона единицы физической величины с сертифицированным значением , выраженным в единицах этой системы (ИСО 5725-4). Итоговая статистическая модель определяется уравнением:
, (А.7)
где - эталонное значение;
- смещение метода.
Совместное исследование может дать смещение со стандартным отклонением , рассчитанным в соответствии с уравнением:
, (А.8)
где - количество повторений в каждой лаборатории;
- количество лабораторий.
Неопределенность , соответствующая этому смещению, задается уравнением:
, (A.9)
где - неопределенность, соответствующая сертифицированному значению , используемому для оценки правильности при совместном исследовании.
Если смещение, оцененное в процессе испытаний, используют при вычислении результатов в лабораториях, соответствующая ему неопределенность, если она не является незначительной, должна включаться в бюджет неопределенности.
А.2.3 Другие воздействия. Объединенная модель
На практике, конечно, и не обязательно включают в себя все изменения, влияющие на результаты измерений. Отсутствие некоторых важных факторов вызвано характером совместных исследований; некоторые факторы могут отсутствовать или не оцениваться случайно или в соответствии с планом эксперимента. Второй принцип, на котором основаны настоящие рекомендации, состоит в том, что воздействия, не наблюдаемые в процессе совместного исследования, или являются незначительными, или должны быть учтены.
Проще всего учесть эти воздействия, рассматривая воздействие отклонений от номинальных значений , необходимых для получения оценки , и предполагая приближенную линейность этих воздействий. Объединенная модель описывается уравнением:
. (А.10)
Суммирование ведется по всем воздействиям, кроме представленных в , , .
Примеры включают в себя воздействие отбора выборки, подготовки испытаний объекта и изменения состава или типа отдельных объектов испытаний. В строгом смысле это линеаризованная форма самой общей модели. При необходимости можно включать в нее члены более высокого порядка или члены, учитывающие корреляцию, как описано в [1].
Очевидно, что центрирование не оказывает влияния на , так что , из чего следует, что для оценки неопределенности, соответствующей , можно использовать уравнение (А.10) и следующее уравнение:
. (A.11)
Суммирование ведется по воздействиям, не учтенным в других членах уравнения.
Следует отметить, что при оценке выполнения метода условия промежуточной прецизионности также могут быть описаны уравнением (А.10), хотя число членов суммы соответственно будет больше, поскольку по сравнению с условиями воспроизводимости в промежуточных условиях меньшее количество переменных будет меняться случайным образом. В общем случае уравнение (А.10) можно применять к любым условиям прецизионности, учитывая, что воздействия суммируются. В предельном случае, когда и равны нулю, а неопределенность общего смещения не определена, уравнение (А.11) становится идентичным уравнению (А.1).
Из этого следует два вывода:
- во-первых, необходимо продемонстрировать, что количественные данные, доступные для совместного исследования, согласуются с рассматриваемыми результатами испытаний;
- во-вторых, даже при согласованности данных совместного исследования для определения реальной оценки неопределенности с учетом дополнительных воздействий ( в уравнении (А.10)) могут быть необходимы дополнительные исследования и предположения. При учете дополнительных воздействий предполагается применение уравнения (А.1).
И, наконец, настоящие рекомендации, утверждая, что надежную оценку неопределенности измерений можно получать на основе анализа данных воспроизводимости и правильности, полученных в соответствии с ИСО 5725-1 - ИСО 5725-6, используют те же самые предположения, что и изложенные в перечисленных стандартах:
a) если используются данные воспроизводимости, предполагается, что все лаборатории подобны по выполнению работ. В частности, их прецизионность повторяемости для данного объекта испытаний одинакова, а лабораторная составляющая смещения в уравнении (А.10) соответствует тому же распределению, что и при совместных исследованиях;
b) испытываемые материалы, используемые в исследовании, являются гомогенными и стабильными.
Следующие разделы включают методологию проверки того, что дополнительные воздействия являются незначительными, а если это не так, их неопределенности учтены в оценке неопределенности результата.
А.3 Сопоставление подходов
Приведенные рассуждения описывают два очевидно различных подхода к оценке неопределенности. Подход GUM [1] описывает неопределенность в виде дисперсии, полученной на основе дисперсий соответствующих входных данных математической модели. Другой подход использует факт, что если одни и те же воздействия заметно изменяются в процессе исследования воспроизводимости, наблюдаемая дисперсия является оценкой той же самой неопределенности. На практике значения неопределенности, полученные на основе различных подходов, различны для разных целей, включая:
a) неполные математические модели (то есть при наличии неизвестных воздействий);
b) неполное или несущественное изменение всех воздействующих факторов в процессе оценки воспроизводимости.
Сравнение двух различных оценок, безусловно, полезно для оценки полноты модели измерений. Однако следует обратить внимание, что наблюдаемую повторяемость или другую оценку прецизионности очень часто рассматривают как отдельную составляющую неопределенности даже в подходе GUM [1]. Точно так же индивидуальные воздействия обычно проверяют на их значимость или оценивают количественно до оценки воспроизводимости. На практике для оценки неопределенности часто используют некоторые элементы обоих подходов.
Когда оценка неопределенности для интерпретации сопровождается результатами, важно, чтобы пробелы в каждом подходе были заполнены. Возможности неполных моделей на практике обычно дополняют консервативными оценками, позволяющими расширять ограничения для неопределенности модели. В настоящих рекомендациях для устранения неадекватных изменений входных воздействий рекомендуется определять оценки дополнительных воздействий. Это является гибридным подходом, объединяя элементы и нисходящего, и восходящего подходов.
Приложение В
(справочное)
Экспериментальная оценка неопределенности
В.1 Процедура оценки коэффициента чувствительности
Если входные величины могут изменяться непрерывно по всему диапазону значений, рекомендуется исследовать воздействие таких изменений. Простая процедура, предполагающая приблизительно линейную зависимость результатов от , следующая:
a) выбирают подходящий диапазон изменения переменной , который должен быть ориентирован на лучшую оценку (или на значение, характерное для указанного метода);
b) выполняют всю процедуру измерений (или ту часть, которая касается ) в каждом из пяти или более уровней с повторением при необходимости;
c) рассчитывают и изображают линейную модель в соответствии с результатами, используя в качестве абсциссы, а результат измерений в качестве ординаты;
d) коэффициентом чувствительности является наклон прямой, характеризуемый коэффициентом в уравнениях (А.1) или (А.12).
Этот подход может дать различные коэффициенты чувствительности для различных объектов испытаний. Это может быть преимуществом во всесторонних исследованиях конкретного объекта или класса объектов. Однако если коэффициент чувствительности должен быть применен к большому диапазону различных ситуаций, важно проверять, чтобы различные объекты вели себя аналогично.
В.2 Простая процедура оценки неопределенности, вызванной случайным воздействием
Если входные величины являются дискретными и/или неконтролируемыми, соответствующую неопределенность можно получать на основе анализа экспериментов, в которых переменная изменяется случайным образом. Например, тип почвы в экологических исследованиях может иметь непредсказуемое воздействие на результаты анализа. Если случайные ошибки не зависят от уровня исследуемой величины, можно исследовать дисперсию ошибки, являющейся результатом таких изменений, используя серию объектов, для которых заданное значение или доступно, или, если изменение известно, может быть выведено теоретически.
Общая процедура включает в себя:
a) выполнение полного измерения на представительном наборе объектов испытаний в условиях повторяемости, используя равное количество повторений для каждого объекта;
b) вычисление разности с заданным значением для каждого наблюдения;
c) проведение анализа результатов (ранжированных по величине) в соответствие c ANOVA с использованием суммы квадратов для формирования оценок внутригрупповой составляющей дисперсии и межгрупповой составляющей дисперсии . Стандартная неопределенность , являющаяся результатом изменения , равна .
Примечание - Если различные объекты или классы объектов по-разному реагируют на исследуемую величину (то есть существует взаимосвязь величины и класса исследуемых объектов), взаимодействие увеличивает значение . Детальное исследование этой ситуации в настоящих рекомендациях не приводится.
Приложение С
(справочное)
Примеры расчета неопределенности
С.1 Измерение содержания монооксида углерода (СО) в отработавших газах автомобиля
С.1.1 Введение
До выпуска на рынок легковые автомобили должны проходить испытания типа транспортного средства для проверки выполнения регулирующих требований относительно количества монооксида углерода в отработавших газах. Верхний предел составляет 2,2 г/км. Метод испытаний описан в Директиве ЕН 70/220 [4], где введены следующие требования:
- цикл двигателя задается как функция скорости (км/ч), времени (с) и оборотов двигателя. Исследуемый автомобиль помещают на специальные ролики для выполнения заданного количества циклов;
- измерительное оборудование - газоанализатор на СО;
- контроль окружающей среды проводят с использованием специальной камеры мониторинга загрязнений;
- персонал имеет специальную подготовку.
Такие испытания на соответствие можно выполнять в испытательной лаборатории предприятия по производству автомобилей или в независимой испытательной лаборатории.
С.1.2 Данные совместных исследований
Перед принятием и использованием такого метода испытаний необходимо оценивать факторы или источники, влияющие на результаты метода испытаний (и, следовательно, на неопределенность результатов испытаний). Такая оценка выполнялась по данным экспериментов, проводимых в различных лабораториях. Для контроля метода испытаний межлабораторный эксперимент проводился в соответствии с ИСО 5725-2. Цель межлабораторного эксперимента состоит в том, чтобы оценить прецизионность метода испытаний при применении его в данном наборе испытательных лабораторий. Оценка прецизионности получена на основе данных, собранных в межлабораторном эксперименте со статистическим анализом в соответствии с ИСО 5725-2. Исследование проводят так, чтобы каждый участник выполнял все необходимые процессы измерений и учитывая воздействующие факторы.
Было установлено, что повторяемость лабораторий значимо не различается, а оценка стандартного отклонения повторяемости метода испытаний равна 0,22 г/км. Оценка стандартного отклонения воспроизводимости метода испытаний равна 0,28 г/км.
С.1.3 Контроль смещения
Оценка правильности (контроль смещения по отношению к эталону) включает в себя методологические и технические вопросы. Не существует "эталонного автомобиля" как образца сравнения. Правильность следует контролировать при калибровке системы испытаний. Например, калибровку анализатора СО можно выполнять с помощью эталонного газа, а калибровку испытательного стенда можно выполнять для величин, таких как время, длина, скорость и ускорение. Знание норм выбросов для различных скоростей и наличие другой аналогичной информации подтверждают, что неопределенность, связанная с этими калибровками, не дает существенных вкладов в неопределенность, связанную с результатами измерений (то есть вся расчетная неопределенность много меньше, чем стандартное отклонение воспроизводимости). Смещение находится под контролем.
С.1.4 Прецизионность
Типовые дублированные испытательные пробеги в лаборатории показали, что повторяемость приблизительно составляет 0,20 г/км и находится в пределах диапазона повторяемости, найденного при межлабораторном исследовании. Таким образом, прецизионность находится под хорошим контролем.
С.1.5 Соответствие объектов испытаний
Метод признают подходящим для всех транспортных средств, относящихся к легковым автомобилям. Хотя большинство транспортных средств признают соответствующими относительно легко и неопределенность имеет тенденцию уменьшаться для более низких уровней выхлопов, неопределенность важна на уровнях, близких к регулирующей границе. Поэтому было решено использовать оценку неопределенности, близкую к регулирующей границе, как корректную и несколько консервативную оценку неопределенности для более низких уровней выделения СО. Необходимо заметить, если испытания транспортного средства показывают выхлоп существенно больше установленной границы, может оказаться необходимым проведение дополнительных исследований неопределенности, если сравнения являются критичными. На практике, однако, такое транспортное средство в любом случае нельзя предлагать для продажи без его модернизации.
С.1.6 Оценка неопределенности
Поскольку предшествующие исследования установили должный контроль смещения и прецизионности в пределах испытательной лаборатории, а также отсутствие воздействующих факторов, не учтенных при совместных исследованиях, стандартное отклонение воспроизводимости, используемое для оценки стандартного отклонения неопределенности, дает расширенную неопределенность 0,56 г/км (2).
Примечание - Интерпретация неопределенности результатов в области проверки соответствия рассмотрена в ИСО 10576-1.
С.2 Определение состава мяса
С.2.1 Введение
Для продукции из мяса необходимо гарантировать, что состав мяса точно заявлен. Состав мяса определяют как комбинацию содержания азота (преобразованного к общему белку) и жира. Представленный пример показывает принцип объединения различных составляющих неопределенности, каждая из которых непосредственно следует в основном из оценок воспроизводимости, как описано в разделе 12.
С.2.2 Основные уравнения
Полный состав мяса определяют в соответствии с уравнением:
, (C.1)
где - общий белок в мясе, выраженный в виде процента массы;
- общее содержание жира, выраженное в виде процента массы.
Белок в мясе вычисляют по формуле
, (С.2)
где является фактором азота, соответствующим материалу;
- полное содержание азота в мясе.
В этом случае идентично общему содержанию азота , определяемому в соответствии с анализом Кьельдаля.
С.2.3 Экспериментальные шаги при определении состава мяса
При определении состава мяса применяют следующие экспериментальные шаги:
a) определяют содержание жира ;
b) определяют содержание азота по Кьельдалю (среднее дублированных измерений);
c) вычисляют содержание обезжиренного мяса и (см. уравнение (С.2));
d) вычисляют общий состав мяса (см. уравнение (C.1)).
С.2.4 Составляющие неопределенности
Составляющие неопределенности связаны с каждой из величин, перечисленных в С.2.3. Наиболее существенным является , составляющий приближенно 90% массы . Наибольшая неопределенность, связанная с , является результатом:
a) неопределенности фактора вследствие неполного знания материала;
b) отклонений метода в условиях воспроизводимости при повторении метода и при точном выполнении метода в течение длительного времени;
c) неопределенности, связанной со смещением метода;
d) неопределенности содержания жира .
Примечание - Неопределенности а), b) и с) связаны с образцом, лабораторией и методом соответственно. Часто бывает полезно грубо рассмотреть каждый из этих трех факторов при идентификации неопределенности, а также неопределенность отдельных шагов в процедуре.
С.2.5 Оценка составляющих неопределенности
С.2.5.1 Неопределенность, соответствующая
Неопределенность, соответствующая , может быть оценена по приведенному в публикациях диапазону значений. В [5] приведены результаты исследований содержания азота в говядине, которые показывают четкое отличие между различными источниками и кусками мяса. В [5] также даны рекомендации по вычислению наблюдаемого стандартного отклонения для 0,052 и относительного стандартного отклонения 0,014 для большого диапазона типов выборок.
Примечание - Непосредственно применены данные содержания азота, определенные в [5], полученные с использованием метода Кьельдаля.
С.2.5.2 Неопределенность, соответствующая
Информация о двух совместных испытаниях [6], [7] позволяет получать оценку неопределенности, вызванной плохой воспроизводимостью или ошибками выполнения метода. Тщательное расследование условий испытаний показывает, во-первых, что каждое исследование проводят по широкому диапазону типов выборки и с хорошим репрезентативным набором компетентных лабораторий, а во-вторых, что стандартное отклонение воспроизводимости хорошо коррелирует с уровнем азота. Для обоих испытаний наиболее подходящая линейная функция задается уравнением . То же самое исследование показывает, что стандартное отклонение повторяемости пропорционально c и межлабораторному члену .
Метод таков, что каждое измерение дублируют и определяют выборочное среднее. Член, соответствующий повторяемости, который представляет собой оценку повторяемости единственного результата, должен быть соответствующим образом приспособлен для учета воздействия среднего двух результатов в лаборатории (см. комментарий, относящийся к в таблице 1). Неопределенность , соответствующая содержанию азота, имеет вид:
. (C.3)
Уравнение (С.3) дает лучшую оценку неопределенности с , соответствующей разумным изменениям при выполнении метода.
Воспроизводимость также используют в качестве критерия оценки прецизионности отдельной лаборатории. Метод устанавливает, что результаты должны быть отброшены, если данные попадают вне 95%-ного доверительного интервала (приблизительно равного ). Эта проверка гарантирует, что внутрилабораторная прецизионность соответствует прецизионности совместного исследования.
Примечание - Если эта проверка терпит неудачу чаще, чем в 5% случаев, вероятно, что прецизионность не находится под достаточным контролем и необходимы действия по исправлению процедуры.
Необходимо также рассматривать неопределенность, соответствующую и являющуюся результатом воздействия неизвестного смещения метода. В отсутствии надежных образцов сравнения сравнение с альтернативными методами, использующими другие принципы, является установленным средством оценки смещения. Сравнение метода Кьельдаля с методом анализа сжиганием для определения полного азота и различных типов выборки установило различие 0,01. Это удовлетворяет критерию 2 (см. ИСО Руководство 33, уравнение (4)), подтверждающему, что неопределенность, связанная со смещением, адекватна значениям воспроизводимости.
С.2.5.3 Неопределенность, соответствующая
Дополнительные данные совместных испытаний для анализа жира [8] дают оценку стандартного отклонения воспроизводимости 0,02. Анализ снова выполняют дважды, а результаты принимаюттолько в случае, если разность находится в соответствующих пределах повторяемости, гарантируя, что лабораторная прецизионность находится под контролем. Предшествующая верификация работы на подходящем образце сравнения для определения жира устанавливает, что неопределенность, связанная со смещением, адекватна значениям воспроизводимости.
С.2.6 Суммарная неопределенность
В таблице С.1 показаны индивидуальные значения и неопределенность, подсчитанная с использованием этих значений.
Таблица С.1 - Бюджет неопределенности для состава мяса
Количественный показатель |
Значение | ||
|
% |
| |
Содержание жира |
5,50 |
0,110 |
0,020 |
Содержание азота |
3,29 |
0,056 |
0,017 |
Фактор азота |
3,65 |
0,052 |
0,014 |
Белок |
90,1 |
90,1x0,022=1,98 |
|
Общий состав мяса |
95,6 |
0,021 |
Уровень доверия в 95% достигается умножением суммарной стандартной неопределенности на коэффициент охвата , равный 2, давая (при округлении до двух знаков после запятой) расширенную неопределенность на состав мяса 4,0%; то есть %.
Примечание - Состав мяса может законно превышать 100%-ный предел в некоторых видах продукции.
Приложение D
(справочное)
Сведения о соответствии ссылочных международных стандартов
национальным стандартам Российской Федерации
Таблица D.1
Обозначение ссылочного международного стандарта |
Обозначение и наименование соответствующего национального стандарта |
ИСО Руководство 33:2000 |
* |
ИСО/МЭК Руководство 43-1:1997 |
* |
ИСО 3534-1:1993 |
ГОСТ Р 50779.10-2000 (ИСО 3534-1:1993) Статистические методы. Вероятность и основы статистики. Термины и определения |
ИСО 5725-1:1994 |
|
ИСО 5725-2:1994 |
ГОСТ Р ИСО 5725-2-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 2. Основной метод определения повторяемости и воспроизводимости стандартного метода измерений |
ИСО 5725-3:1994 |
ГОСТ Р ИСО 5725-3-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 3. Промежуточные показатели прецизионности стандартного метода измерений |
ИСО 5725-4:1994 |
ГОСТ Р ИСО 5725-4-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 4. Основные методы определения правильности стандартного метода измерений |
ИСО 5725-5:1998 |
ГОСТ Р ИСО 5725-5-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 5. Альтернативные методы определения прецизионности стандартного метода измерений |
ИСО 5725-6:1994 |
ГОСТ Р ИСО 5725-6-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 6. Использование значений точности на практике |
ИСО/ТО 7871:1997 |
ГОСТ Р 50779.45-2002 Статистические методы. Контрольные карты кумулятивных сумм. Основные положения |
ИСО 8258:1991 |
ГОСТ Р 50779.42-1999 Статистические методы. Контрольные карты Шухарта |
ИСО 10576-1:2003 |
|
ИСО 11648-1 |
* |
* Соответствующий национальный стандарт отсутствует. До его утверждения рекомендуется использовать перевод на русский язык данного международного стандарта. Перевод данного международного стандарта находится в Федеральном информационном фонде технических регламентов и стандартов. |
Библиография
[1] |
Guide to the expression of uncertainty in measurement (GUM) 1995 |
[2] |
ISO/IEC VIM: 1993 (International vocabulary of basic and general terms in metrology (VIM)) |
[3] |
Recommendation INC-1 (1980), BIPM |
[4] |
European Directive 70/220/EEC: 1970 Measures to be taken against air pollution by emissions from motor vehicles |
[5] |
Analytical Methods Committee. Analyst, 118(1993), p.1217 |
[6] |
Shure B., Corrao P.A., Glover A., Malinowski A.J.J. AOAC Int., 65 (1982), p.1339 |
[7] |
King-Brink M., Sebranek J.G.J. AOAC Int., 76 (1993), p.787 |
[8] |
Breese Jones D. Американский Проспект Министерства земледелия, N 183 (август 1931) |