Создание систем поддержки принятия решений
| Категория реферата: Рефераты по информатике, программированию
| Теги реферата: ответы на кроссворды, бесплатные шпоры
| Добавил(а) на сайт: Леонтий.
Предыдущая страница реферата | 1 2 3 4 5 6 | Следующая страница реферата
Иными словами, бизнес-событие является более устойчивым и более тесно связанным с информационными и управляющими потоками понятием, чем бизнес- процесс.
Через анализ бизнес-событий необходимо перейти к анализу данных, используемых предприятием. При этом должна быть собрана информация об используемых внешних данных и их источниках; о форматах данных, периодичности и форме их поступления; о внутренних информационных системах предприятия, их функциях и алгоритмах обработки данных, используемых при наступлении бизнес-событий. Такой анализ, как правило, производится при проектировании любой информационной системы. Особенность анализа данных при проектировании СППР на основе ИХ состоит в необходимости создания моделей представления информации. То, что в транзакционных системах является вторичным понятием, а именно состав и форма отображаемых данных, в СППР приобретает особую важность, так как нужно выявить все без исключения признаки, требуемые для менеджерского состава.
При проектировании транзакционной системы обычно строго выдерживается
последовательность процессов: бизнес-анализ, концептуальная модель данных, физическая модель данных, структура интерфейса и т. п. Возврат на
предыдущий уровень происходит редко и считается отклонением от нормального
хода выполнения проекта. В случае СППР на основе ХД нормальным считается
итерационный, а иногда и параллельный, характер моделирования, при котором
возврат на предыдущую стадию - обычное явление. Это связано с
необходимостью выделения всех требуемых данных для произвольных запросов
(ad-hoc), для чего следует составить исчерпывающий перечень необходимых
данных и построить схему их связей через бизнес-события. При этом из общего
массива выделяется значимая информация и выясняется потребность в
дополнительных источниках данных для принятия решений.
В ходе анализа бизнес-событий необходимо также сформировать схему взаимодействия между транзакционной и аналитической системами на предприятии. Помимо того, что транзакционная система зачастую является важнейшим источником данных для хранилища, желательно задействовать один и тот же пользовательский интерфейс в ИСР и СППР. Подходы к совместному использованию этих систем определяются именно на данной фазе выполнения проекта.
Итак, по результатам анализа бизнес-процессов и структур данных предприятия отбирается действительно значимая для бизнеса информация с учетом неопределенности будущих запросов. Следующий шаг связан с пониманием того, в каком виде и на каких аппаратных и программных платформах размещать структуру данных СППР на основе ХД.
2.2. Выбор модели данных Хранилища
В самом простом варианте для Хранилищ Данных используется та модель
данных, которая лежит в основе транзакционной системы. Если, как это часто
бывает, транзакционная система функционирует на реляционной СУБД (Oracle,
Informix, Sybase и т. п.), самой сложной задачей становится выполнение
запросов ad-hoc, поскольку невозможно заранее оптимизировать структуру БД
так, чтобы все запросы работали эффективно.
Однако практика принятия решений показала, что существует зависимость
между частотой запросов и степенью агрегированности данных, с которыми
запросы оперируют, а именно чем более агрегированными являются данные, тем
чаще запрос выполняется. Другими словами, круг пользователей, работающих с
обобщенными данными, шире, чем тот, для которого нужны детальные данные.
Это наблюдение легло в основу подхода к поиску и выборке данных, называемого Оперативной Аналитической Обработкой (On-line Analytical
Processing, OLAP).
OLAP-системы построены на двух базовых принципах:
- все данные, необходимые для принятия решений, предварительно агрегированы на всех соответствующих уровнях и организованы так, чтобы обеспечить максимально быстрый доступ к ним;
- язык манипулирования данными основан на использовании бизнес-понятий.
В основе OLAP лежит понятие гиперкуба, или многомерного куба данных, в ячейках которого хранятся анализируемые (числовые) данные, например объемы продаж. Измерения представляют собой совокупности значений других данных, скажем названий товаров и названий месяцев года. В простейшем случае двумерного куба (квадрата) мы получаем таблицу, показывающую значения уровней продаж по товарам и месяцам. Дальнейшее усложнение модели данных может идти по нескольким направлениям:
- увеличение числа измерений - данные о продажах не только по месяцам и товарам, но и по регионам. В этом случае куб становится трехмерным;
- усложнение содержимого ячейки - например нас может интересовать не только уровень продаж, но и, скажем, чистая прибыль или остаток на складе. В этом случае в ячейке будет несколько значений;
- введение иерархии в пределах одного измерения - общее понятие «Время» естественным образом связано с иерархией значений: год состоит из кварталов, квартал из месяцев и т. д.
Речь пока идет не о физической структуре хранения, а лишь о логической модели данных. Другими словами, определяется лишь пользовательский интерфейс модели данных. В рамках этого интерфейса вводятся следующие базовые операции:
- поворот;
- проекция. При проекции значения в ячейках, лежащих на оси проекции, суммируются по некоторому предопределенному закону;
- раскрытие (drill-down). Одно из значений измерения заменяется совокупностью значений из следующего уровня иерархии измерения; соответственно заменяются значения в ячейках гиперкуба;
- свертка (roll-up/drill-up). Операция, обратная раскрытию;
- сечение (slice-and-dice).
В зависимости от ответа на вопрос, существует ли гиперкуб как отдельная
физическая структура или лишь как виртуальная модель данных, различают
системы MOLAP (Multidimensional OLAP) и ROLAP (Relational OLAP). В первых
гиперкуб реализуется как отдельная база данных специальной нереляционной
структуры, обеспечивающая максимально эффективный по скорости доступ к
данным, но требующая дополнительного ресурса памяти. MOLAP-системы весьма
чувствительны к объемам хранимых данных. Поэтому данные из хранилища
сначала помещаются в специальную многомерную базу (Multidimensional Data
Base, MDB), а затем эффективно обрабатываются OLAP-сервером.
Одним из первых производителей таких систем стала компания Arbor
Software, выпустившая продукт Essbase. Компания Oracle предлагает систему
Oracle Express, интегрированную с универсальным Oracle Server. Известны и
другие производители MOLAP-систем, например SAS Institute. Однако, в
отличие от Essbase, их продукты часто интегрированы в приложения, созданные
для конкретных вертикальных или горизонтальных рынков, и поставляются лишь
в составе этих приложений.
Для систем ROLAP гиперкуб - это лишь пользовательский интерфейс, который эмулируется на обычной реляционной СУБД. В этой структуре можно
хранить очень большие объемы данных, однако ее недостаток заключается в
низкой и неодинаковой эффективности OLAP - операций. Опыт эксплуатации
ROLAP-продуктов показал, что они больше подходят на роль интеллектуальных
генераторов отчетов, чем действительно оперативных средств анализа. Они
применяются в таких областях, как розничная торговля, телекоммуникации, финансы, где количество данных велико, а высокой эффективности запросов не
требуется. Примерами промышленных ROLAP-систем служат MetaCube фирмы
Informix и Discoverer 3.0 фирмы Oracle. На практике иногда реализуется
комбинация этих подходов.
Некоторые поставщики программных продуктов (Sybase - Sybase IQ,
Teradata) поставляют более сложные решения, основанные на специальных
методах хранения и индексации данных и связей между данными.
Рекомендуем скачать другие рефераты по теме: мировая экономика, титульный курсовой работы.
Категории:
Предыдущая страница реферата | 1 2 3 4 5 6 | Следующая страница реферата