У цьому розділі розглядаються основні числові характеристики матриць (операторів) і методи їх обчислення. Саме знання основних числових характеристик оператора дозволяє прогнозувати вплив цього оператора в просторі і дозволяє усвідомлено вирішувати основну задачу - знаходження рішення операторного рівняння виду.
Норми векторів і матриць
У векторному просторі можна визначити наступний функціонал, що володіє властивостями норми (так звана - норма):
При різних значеннях параметра отримаємо різні норми, практично важливі з них наступні (при відповідно):
Норми і у векторному просторі називаються еквівалентними, якщо існують такі позитивні константи і. що для будь-якого елемента виконується нерівність.
Все-норми в просторі еквівалентні. Зокрема виконані нерівності:
З еквівалентності норм і слід збіжність послідовності в нормі за умови її збіжності в нормі і навпаки.
Приклад: Обчислити-норми вектора.
Так як простір матриць ізоморфно векторному простору. то в ньому також визначаються-норми, засновані на відповідних норма векторів за правилом
Оскільки . то видно, що норма матриці (оператора) є норма найбільшого вектора, отриманого дією оператора на нормовані (одиничної довжини в норма) вектори. Побудовані так норми матриць є операторними або підлеглими відповідним нормам векторів. Підпорядкована норма матриці (оператора) - є максимальне відхилення від нуля деформованої під дією даного оператора одиничної сфери простору (див.рис.). З визначення 2.18 слід, що виконано так зване умова узгодження.
Таким чином, підпорядкована норма - є найменша серед узгоджених норм.
Формули обчислення підлеглих норма матриць (при) наведені нижче:
Поряд з цими нормами розглянемо евклидову норму матриці
Приклад: Обчислити-норми і евклидову норму матриці.
Вирішимо характеристичне рівняння для визначення власних значень. Розкриваючи визначник в лівій частині, одержимо квадратне рівняння або. Його коріння. Найбільше власне значення -. Отже,.
Введені норми еквівалентні, тому що мають місце оцінки:
При практичному застосуванні слід використовувати підлеглі норми векторів і матриць, тобто якщо, наприклад, доведено збіжність методу простих ітерацій в матричної нормі. то і перевірку закінчення ітераційної процедури необхідно здійснювати в підпорядкованої нормі вектора.
норма матриці вимагає обчислення власних значень матриці. що є досить складним завданням для матриць великих розмірностей (в цьому ми переконаємося нижче). Перша оцінка, дозволяє замість підпорядкованої норми використовувати еквівалентну їй евклидову норму матриці, узгоджену з нормою вектора.
Рішення операційного рівняння. як було показано вище на прикладі СЛАР другого порядку, може виявитися завданням некоректної в силу нестійкості одержуваного рішення (за умови існування зворотного оператора). Рішення сильно відхиляється при малих відхиленнях правій частині. Це означає, що зворотний оператор має велику норму (великий коефіцієнт розтягування), тобто в матриці виникають великі елементи. Кажуть, що такий оператор є погано обумовленою.
Нехай - точне рішення рівняння. а - його наближене рішення. Позначимо через - похибка наближеного рішення, а через - невязку.
Оскільки . тобто похибка і невязка пов'язані рівнянням. звідки. Тобто похибка визначається нев'язкої. У загальному випадку помилково вважати, що трохи невязки призводить до малості похибки в рішенні. Це не вірно в класі погано обумовлених операторів.
Необхідно визначення кількісних характеристик оператора, що дозволяють судити про взаємозв'язок норми похибки і норми нев'язки. На практиці інтерес представляють не абсолютні величини і. а їх відносні зміни і. Важлива оцінка виду. Знайдемо коефіцієнт. залежить від оператора. Оскільки . то. Оскільки . то. Перемножимо ці нерівності. Отримаємо. Розподіл на дає.
Коефіцієнт називають числом обумовленості лінійного оборотного оператора (матриці).
Якщо число велике, то оператор вважається погано обумовленим. Поняття «велике» чи «не велика» звичайно залежить від конкретної розв'язуваної задачі, від точності, з якою потрібно знайти рішення. Оскільки . то число обумовленості - величина не менша одиниці.
Видно, що число обумовленості залежить від вибору норми оператора. Оцінимо його через власні числа оператора.
Оскільки і. то і. тоді
Число, яке обчислюється як відношення найбільшого по модулю власного значення оператора до найменшого по модулю власного значення, називається числом Тодда. Позначимо його через. Маємо наступну нижню оцінку числа обумовленості:.
Число Тодда є відношення найбільшої піввісь до найменшої піввісь еліпсоїда розсіювання оператора. відношення найбільшого коефіцієнта розтягування одного власного підпростору до найменшого коефіцієнта розтягування іншого власного підпростору оператора (див.рис.).
У літературі зустрічаються й інші визначення чисел обумовленості [. ], Що мають імовірнісний сенс відносин середньоквадратичних відхилень.
Оскільки більшість методів рішення рівняння засноване на послідовному перетворенні шляхом умножений зліва на елементарні матриці до деякого простішого вигляду - діагонального, трикутного і т.д. то слід дослідити як впливають дані множення на обумовленість.
Справедливі наступні твердження.
Якщо матриця не вироджена і. то множення матриці на зліва не змінює числа обумовленості матриці.
тоді і тільки тоді, коли. що.
Число обумовленості інваріантної щодо множення матриці на константу, тобто .
Зауваження: Оператор може бути погано обумовлений, навіть якщо він і не має малих власних значень. З іншого боку, наявність дуже малого по модулю власного значення тягне погану обумовленість оператора.
Зауваження: Не вірно твердження, що погано-обумовлений оператор - є майже вироджених оператор (тобто). Умова є необхідною, але не достатньою ознакою поганої обумовленості. Наприклад, розглянемо матрицю. де - позитивне мале число, а одинична матриця - досить високого порядку. . але визначник при великих прагнути до нуля, тому що .
Геометрично, погану обумовленість СЛАР можна трактувати наступним чином: лінійні підпростори, що задаються рівняннями системи або самі «майже» паралельні, або їх перетину утворюють «майже» паралельні підпростору меншою розмірності.
Розглянемо систему. Вона не виродилися -. Її число обумовленості - велике. Кожне рівняння системи - задає рівняння прямої в площині. Видно, що прямі «майже» паралельні. Кутові коефіцієнти їх близькі (і), але не рівні, і, отже, прямі перетинаються. Зміна правій частині першого рівняння на 0.1 тягне за собою зміну точки перетину першої прямої з віссю на 0.01 і паралельний перенесення першої прямої. Точка перетину цих прямих - нове рішення системи - при майже паралельних прямих далеко «тікає» від старого рішення (див.рис.).