Информационные технологии. Состояние и перспективы
(доложено на LII конференции МФТИ 28-го ноября 2009 г.)
Семенов Ю.А. (ГНЦ ИТЭФ)
ИТ является наиболее динамично развивающейся областью. Интернат уменьшил на порядок одну из переменных, определяющих темп научно-технического прогресса, время с момента появления новой идеи или факта до попадания этих данных исследователям остального мира. Эта задержка оставалось постоянной с момента появления первого научного журнала в 1650 году до конца 20-го века, кода их стало 100000, и составляла около года. Сетевые технологии стали основой научной и технологической инфраструктуры и базой многих видов бизнеса. В то же время некоторые эксперты считают ИТ одной из причин современного экономического кризиса. Первые лопнувшие фирмы-пузыри были из ИТ-области.
Сегодняшний этап характеризуется быстрым ростом пропускной способности магистральных каналов (40-100Гбит/с), развитием беспроводных и мобильных технологий (WiMAX, 3F-4G [1], Zigbee [2], Bluetooth [3]), разработкой пассивных оптических локальных сетей (PON, EPON, GEPON [4]), широким внедрением технологий GRID для распределенных вычислений, управления и хранения данных, применением техники P2P [5] для целей цифрового телевидения и в файлообменных сетях. Отдельно следует отметить развитие виртуализации, green- cloud-компьютинга [9], что предполагает существенное сокращение энергопотребления и повышения эффективности использования вычислительных средств, а также SaaS и Unified Communications. Этими способами США намерены сократить энергопотребление вычислительной и сетевой техники примерно в 2 раза. Достигнут ощутимый прогресс в развитии поисковых систем, создана база для организации мультимедийного поиска. Формируются сети на основе GMPLS, развивается техника WEB 2.0. Но в то же самое время хакерство перешло на коммерческие рельсы и приобрело всемирный масштаб, а SPAM поглощает более 90% трафика.
Число проблем, которые предстоит решить, со временем только увеличивается. Назову лишь некоторые из них.
- Семантические сети, искусственный интеллект, решение проблемы контекста. На решение этой проблемы уже потрачены миллиарды долларов, но прогресс пока крайне ограничен. В США одним из приложений в случае успешного решения проблемы семантических сетей считается создание безлюдных видов оружия поля бой. Но на самом деле попутно будет решена задача эффективности поисковых и экспертных систем, программирования на естественном языке и многое другое [6]. Семантические сети не являются чем-то новым, человечество исследует их как минимум с 14-го века (см. рис. 1). Просто сегодня ребрам этих деревьев стали приписывать метрики, расширилось многообразие семантических отношений. При этом предполагается, что существует множество семантических деревьев, характеризующих общие языковые связи. Тогда при выявлении контекстного значения определенного слова или группы слов в пределах конкретного текстового фрагмента, строятся семантические деревья для этого фрагмента. В этих деревьях веса берутся из общеязыковых деревьев. Если слово или группа слов имеет более одного значения, ребра графа с наибольшим весом могут указать на предпочтительное контекстное значение.
Рис. 1. Дерево понятий, нарисованное логиком Питером Испанским (1329 год)
- Сетевая и информационная безопасность. Человеческая цивилизация во все большей мере зависит от сетевых и информационных технологий. На очереди разработка лекарств, ориентированных на индивидуальный генный набор каждого человека. Можно себе представить, что в этом случае от надежности сети зависит уже не просто благосостояние, но само здоровья человека. В 2009 каждый день выявляется 23500 новых зараженных WEB-страниц, т.е. по одной каждые 3,6 секунды. Это в 4 раза больше чем за аналогичный период в 2008 году. Независимое агентство AV-Test.org накопило 22.5 миллионов образцов вредоносных кодов (против 12,3 миллионов в 2008). Выявляется 15 новых фальшивых антивирусных WEB-сайтов в день. 11% всех компьютеров вовлечены, по крайней мере, в одну botnet. 23% домашних машин заражены каким-либо вредоносным кодом. 72% корпоративных сетей с числом машин более 100 имеют хотя бы одну зараженную ЭВМ. Зарегистрированы botnet с числом машин более 2 миллионов. SPAM уже сегодня составляет более 90% трафика. Взлом машин поставлен на поток, сегодня это выгодный бизнес. Сеть Президиума РАН атакуется от 5000 до 50000 раз за один час. Это указывает на то, что нужны энергичные международные усилия сегодня, иначе может наступить информационный хаос [7].
В качестве примера привожу сайт международного форума «Высокие технологии 21-го века»
Рис. 2. Сайт форума ”Высокие технологии 21-го века. 2008”
Примером актуальности проблемы может также служить карат мира (рис.2а), где отображается географическое распределение атак МСЦ РАН
(данные за 1 час). Самые большие квадратики соответствуют более 1000 атак в час.
Рис. 2.а
Рис. 2.b. Число выявленных вредоносных кодов в WEB-приложениях по годам (2009h1 - первое полугодие 2009)
- Безопасность программ. В стандартном ядре ОС исходный текст содержит около 5 миллионов строк кода. Если учесть прикладные программы, число строк кода следует удвоить. По данным космического агентства США в среднем 10-100 строк кода содержат, по крайней мере, одну ошибку. Если исключить ошибки в комментариях и отладочных секциях, куда программа обычно не попадает, число ошибочных строк кодов на каждой из машин может достигать 100000. По большей части эти ошибки находятся в редко исполняемых частях программы. Основные ветви программы исправлены в процессе отладки. Это указывает на важность верификации и сертификации программ (code-checker’ы), которые выявляют ошибки алгоритмов, а не синтаксиса. Это область в РФ находится в зачаточном состоянии [8].
- Распознавание образов. Здесь имеется в виду не только динамические графические, видео или акустические образы, где наблюдается некоторый прогресс (MPEG-7, альфа-маски и объектный подход). Сюда относится и создание мультимедийных баз данных. Но это также и распознавание состояния системы (сервера, сети, системы управления, автоматическое выявление предкризисных состояний). Такая техника нужна для управления потенциально опасными производствами. Проблема здесь в том, что многие статусные параметры имеют нестационарное статистические распределения. Нужно разработать математические алгоритмы минимизации дисперсии при нестационарных статистических распределениях. Распознавание ситуации по многопараметрическому вектору состояния.
- Сквозная гарантия качества обслуживания. Эта проблема должна быть решена в процессе интеграции ЦТВ, Интернет, средств общения, включая мобильные UC (Unified Communication [9]). Эта проблема актуальна не только для информационных сетей, но и, например, для уличного трафика.
- Разработка распределенных систем управления, гарантирующих повышенную надежность. В таких системах отказ отдельных узлов или каналов сети не приводит к выходу из строя системы в целом. Такие сети могут строиться на основе технологий P2P или GRID [10]. Такие сети особенно важны для потенциально опасных технологических процессов, например, для АЭС. Здесь также как и в предыдущем пункте могут использоваться сети типа ZigBee.
- Каналы и сети, рассчитанные на высокие импульсные нагрузки [11]. Интернет, в частности основной транспортный протокол ТСР не рассчитан на большие импульсные нагрузки, и плохо переносит перегрузки (это относится к переключателям и маршрутизаторам). В настоящее время разрабатываются принципиально новые схемы, например, показанная на рис. 3.
Рис. 3. Схема оптического переключателя-маршрутизатора
- Стандартизация и многообразие типов ОС и приложений. Чрезмерная унификация может привести к тому, что первый же вирус обрушит систему в целом. Нужно искать эффективный баланс между унификацией и многообразием.
- Создание крупных информационных центров для накопления технологической информации из различных областей науки и технологии.
- Кажущемуся беспредельному росту производительности вычислительных машин скоро придет конец. Мы приближаемся к предельной частоте работы твердотельных приборов, связанной с временем поляризации диэлектрика 10-13сек. Конечно, какое-то время можно будет компенсировать это ограничение за счет распараллеливания, но и эта технология не может обеспечивать беспредельного роста быстродействия при выполнении вычислительных операций. Нужно искать другие технологии. Аналогичные проблемы просматриваются и в сфере увеличения плотности компонентов на кристалле (ведь нельзя сделать транзистор размером в атом). Так что действию закона Мура (сформулирован в 1965 году одним из основателей Intel), согласно которому плотность элементов удваивается каждые полтора года, приходит конец.
Приведенный перечень нельзя признать исчерпывающим. Но успеха в некоторых из названных областей реально достичь в ближайшие годы.
Преимущество ИТ перед другими исследованиями и разработками заключаются в том, что требуют минимальных издержек (на одного человека обычно достаточно одного компьютера, подключенного к сети). Для внедрения разработанного также не нужно особых издержек. Для решения задач в области ИТ можно формировать группы участников из самых разных организаций, работающих в разных городках и даже странах.
Международное сотрудничество во многих отраслях ИТ может затормозить отток молодых специалистов из РФ, ведь они смогут участвовать в крупных проектах, не покидая своих рабочих мест. Такое сотрудничество упростит накопление навыков и знаний внутри страны.
Идеальный квантовый компьютер сможет выполнять до 10 квадрильонов операций в сек.
Ссылки
- Сети 3G
- Сети Zigbee
- Сети Bluetooth
- Пассивные оптические сети
- Технология P2P
- Семантические сети
- Обзор состояния сетевых технологий за последние годы
- Доклад о методах разработки безопасных программ на форуме "Технологии 21-го века"
- Направления и тенденции развития ИТ-технологий
- Обзор по технологиям GRID
- Обзор по проектам развития сетей для науки (ESNET)
- Ю.А.Семенов “Алгоритмы телекоммуникационных сетей”, Бином, М, 2007. Три тома, 1970 страниц
|