- BI (бизнес-аналитику) в компании применяют для…- прогнозирования финансового состояния
- распределения премий между сотрудниками
- анализа инновационных товаров
 
- Big Data отражает эффект (феномен)…- разнообразия данных
 
- BigData – это …- Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
- Колоссальный объем данных, собранных человечеством
 
- Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для…- Принятия решений в различных сферах человеческой деятельности
- Уменьшения стоимости анализа данных
 
- Hadoop – это…- набор утилит, и программный каркас для выполнения распределённых программ, работающих на кластерах
 
- R не является…- языком программирования с динамической типизацией данных
 
- Аналитик это …- специалист в области анализа и моделирования
- человек, который имеет опыт в программировании
 
- В 2016 году программа AlphaGo обыграла одного из мировых по шахматам чемпионов Ли Седоля. Какая компания разработала ИИ AlphaGo?
- В Big Data возможны…- разные типы и области происхождения данных
 
- В Big Data не акцентируется…- Voicing (Озвучивание)
 
- В базе данных есть следующие записи: длительность звонков, общее число звонков, общее число переданных сообщений, количество потраченных гигабайтов трафика. Вы хотите предсказывать объем трафика, который потратят клиенты. Что будет объектом модели в этой задаче?- Клиент
 
- В какие игры нейросеть еще не научилась обыгрывать человека?- Бридж
 
- В каком году впервые был введен термин Большие данные?- 2008
 
- В каком из приведённых примеров наиболее эффективны NoSQL решения типа ключ-значение?- потоковая обработка логов кластера серверов и быстрого сохранения без требования оперативной аналитики
 
- В краудсорсинге вклад в проект каждого участника осуществляется…- ресурсами – компьютер, время и др.
 
- В краудсорсинге могут быть задействованы…- профессионалы и любители
 
- В любых Big Data информация целиком распределена…- по всей сети
 
- В результате использования инструментов Data Mining пользователь может …- Получить подтверждение или опровержение гипотез, выдвинутых пользователем
 
- В чём преимущество колоночно-ориентированных СУБД?- они имеют более гибкие возможности аналитики
 
- Вы взяли среднесуточные температуры за последние два года и построили регрессионную модель для прогнозирования дневного спроса на товары. Для мороженого она работает хорошо, а для шуб плохо. Почему?- Шубы продают нечасто — мало данных
 
- Выберите верное высказывание…- проблема больших данных – это такая проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна
 
- Выберите неверное высказывание про MapReduce…- MapReduce был придуман разработчиками Hadoop
 
- Выберите неверное высказывание…- большие данные – это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров
 
- Выберите технологию потоковой обработки событий в режиме реального времени- Apache Kafka
- Spark Streaming
 
- Горизонтальная масштабируемость при обработке Big Data – это…- увеличение скорости обработки при росте объема данных
 
- Дайте определение Big Data- Комплексный набор подходов, инструментов и методов обработки структурированных и неструктурированных данных колоссальных объемов
 
- Дайте определение Map Reduce…- Модель распределенных вычислений, предназначенная для параллельных вычислений над очень большими (до нескольких петабайт) объемами данных
 
- Данные могут быть получены в результате...- Измерений
- Экспериментов
- Арифметических и логических операций
 
- Данные представляют собой...- Факты и графики
- Текст
- Картинки, звуки, аналоговые или цифровые видео-сегменты
 
- Для машинного обучения подходят данные…- Любых форматов в цифровом виде
- Предварительно подготовленные, очищенные от ошибок, пропусков и выбросов, а также нормализованные и представленные в виде числовых векторов
 
- Для обработки больших данных наиболее актуально…- привлечь больше вычислительных мощностей для обработки
- ускорить обработку или увеличить объем обрабатываемых данных
 
- До появления Big Data невозможно было…- обрабатывать всю вузовскую информацию полностью
- работать с данными дистанционного зондирования Земли
 
- До появления Data Mining невозможно было найти связи…- студентов вуза и их успеваемости по предмету
- рекламирования и покупательской активности на сайте веб-магазина
 
- Допустим, нам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения нам в этом пригодится?- Компьютерное зрение
 
- Закончите следующее предложение: "С точки зрения машины, информация становится структурированной, если...- Машина проинструктирована, каким образом её обрабатывать
 
- Изначально Big Data применяли лишь в…- академической среде
 
- Интеллектуальный анализ данных или Data Mining…- Информация, которая организована и проанализирована с целью сделать ее понятной и применимой для решения задачи или принятия решений.
 
- Искусственные нейронные сети (ИНС) — модели машинного обучения, использующие комбинации распределенных простых операций, зависящих от обучаемых параметров, для обработки входных данных. Какого вида ИНС не существует?- Наивные
 
- Итак, вы решили работать с большими данными. Какой из этих инструментов вам вряд ли пригодится?- Texmaker
 
- Как происходит обучение нейронной сети?- сеть запускается на обучающем множестве, и подстраиваются весовые значения
 
- Какая компания создала технологию MapReduce?
- Какая информация о пациентах, находящаяся в распоряжении медицинской организации, относится к персональным данным?- Диагнозы конкретных пациентов
- Данные из электронной медицинской карты без Ф.И.О.: дата рождения, адрес регистрации и пр.
 
- Какая компания создала технологию MapReduce?
- Какие задачи решают графовые БД?- встроенная обработка данных сетевыми методами
 
- Какие из задач решаются Big Data?- Все вышеперечисленное
 
- Какие из следующих технологий СУБД не используют принцип MapReduce?- Cassandra
- Redis
 
- Какие модули по умолчанию входят в состав проекта Apache Hadoop?- HDFS
- MapReduce
- YARN
 
- Какое API было добавлено в Hadoop v2.0?- YARN
 
- Какое из нижеперечисленных понятий не относится к перечню необходимых критериев для создания проекта, связанного с Большими данными?- Географическое положение
 
- Какой тип NoSQL решения наиболее эффективен для потоковой обработки логов кластера серверов и быстрого сохранения без требования оперативной аналитики?- ключ-значение
 
- Какой язык программирования из перечисленных является наиболее важным для аналитика?- R
 
- Краудсорсинг – модель привлечения…- неограниченного числа и потенциала участников
 
- Краудсорсинг большого проекта невозможен без…- декомпозиции
 
- Кто ввел термин Большие данные?- Клиффорд Линч
 
- Кто и в каком году впервые ввел термин «Big Data»?- Клиффорд Линч, редактор журнала Nature, в 2008 году
 
- Локальность данных Big Data – это…- время коммуникации не может быть выше времени обработки
 
- На каком языке программирования можно разрабатывать приложения Hadoop MapReduce?- Практически на любом: Java, C++ и другие компилируемые языки
 
- На основе какого языка был создан R?- S
 
- Недостатком краудсорсинга является…- ограниченная мотивация
 
- Нейросети хорошо проявляют себя не только в распознавании, но и в генерации изображений. Но кое с чем у них все-таки возникают проблемы. С чем именно?- Текстуры
 
- Обрабатывать большие данные (Big Data) лет десять назад мешали…- недостаточные вычислительные мощности
 
- Одна из главных целей Big Data – это…- нижение издержек операций
 
- Одна из главных целей Data Mining – это получение…- связей малых выборок данных, распространение их на большие массивы
 
- Основными достоинствами краудсорсинга являются…- оперативность реализации проекта и распределения прибыли
 
- Особых успехов нейросети достигли в работе с изображениями. Но что из этого нейросети не могут сделать?- Догадаться, что вы нарисовали
 
- Отказоустойчивость Big Data – это, когда…- сбой в одном звене системы не ведет к сбоям в других звеньях
 
- Отметьте верное понимание Variety в контексте характеристик Big Data…- разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
 
- Отметьте причину создания NoSQL баз данных…- высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности
 
- Перечислите четыре основных характеристики Big Data…- Variety, Velocity, Volume, Value
 
- Подходы к построению моделей Data Mining- статистический и на основании машинного обучения
 
- Пример благоразумного использования Hadoop…- посекундное сохранение данных температуры, поступающих со всех городов России (по одному показанию на город, всего городов 1100 шт)
 
- Примером применения Big Data не может быть…- родительский контроль
 
- Принцип 3Vs расшифровывается как...- Volume, Variety, Velocity
 
- Принципом Big Data не является…- локализация данных
 
- Расписание движения поездов может рассматриваться как пример…- Табличной модели
 
- С помощью Big Data клиентский компьютер может обрабатывать до…- терабайтов данных
 
- Сколько Петабайт в Зеттабайте?- 1024
 
- Специалист по работе с данными знает и умеет многое, но нельзя знать всего. Чего не преподают на курсах по Data Science?- Масс-спектрометрия
 
- Теперь вам нужно обучить нейросеть распознавать на фото воздушные шары. Коллега предлагает перевести все изображения для обучения нейросети в черно-белые. Что вы ответите?- Нет, потому что это ухудшит результат
 
- Традиционные методы визуализации могут находить следующее применение…- Представлять пользователю информацию в наглядном виде
- Компактно описывать закономерности, присущие исходному набору данных
 
- Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?- хранить данные с изменяющейся структурой
 
- Чем глубокое обучение отличается от машинного?- Машинное обучение изучает алгоритмы, обучающиеся без использования специального свода правил, а глубокое обучение — это машинное обучение нейронных сетей с более чем тремя скрытыми слоями нейронов
 
- Чем искусственная нейронная сеть похожа на естественные нейронные сети в мозге?- Их объединяет лишь общий принцип построения: это последовательность связанных друг с другом нейронов
 
- Что будет объектом в задаче поиска уходящих от компании клиентов?- Клиент
 
- Что из перечисленного помогает следить за эволюцией документа, над созданием которого работает одновременно большое количество авторов?- Исторический поток
 
- Что из этого не является типом визуализации?- Текст
 
- Что не является целью процесса Business Intelligence?- Модификация существующего программного обеспечения
 
- Что необходимо выполнить, чтобы нейросеть могла помочь в формировании решения…- Обучить на примерах
 
- Что означает термин «Big Data» в информационных технологиях?- Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
 
- Что означает термин «Business Intelligence» в информационных технологиях?- Методы и инструменты для перевода необработанной информации в осмысленную, удобную для восприятия форму
 
- Что означает термин NoSQL?- Не только SQL
 
- Что такое EDA?- Исследовательский анализ данных
 
- Что такое Spark?- Технология распределенных вычислений
 
- Что такое SQL?- Язык структурированных запросов
 
- Что такое БУСТИНГ?- Построение ансамбля моделей машинного обучения
 
- Эффективно применять Data Mining с целью защиты от…- мошенников
 
Введение в технологии Big Data - Ответы на тест Синергия
июня 04, 2024
 


