Введение в технологии Big Data - Ответы на тест Синергия

Введение в технологии Big Data
  1. BI (бизнес-аналитику) в компании применяют для…
    • прогнозирования финансового состояния
    • распределения премий между сотрудниками
    • анализа инновационных товаров
  2. Big Data отражает эффект (феномен)…
    • разнообразия данных
  3. BigData – это …
    • Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
    • Колоссальный объем данных, собранных человечеством
  4. Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для…
    • Принятия решений в различных сферах человеческой деятельности
    • Уменьшения стоимости анализа данных
  5. Hadoop – это…
    • набор утилит, и программный каркас для выполнения распределённых программ, работающих на кластерах
  6. R не является…
    • языком программирования с динамической типизацией данных
  7. Аналитик это …
    • специалист в области анализа и моделирования
    • человек, который имеет опыт в программировании
  8. В 2016 году программа AlphaGo обыграла одного из мировых по шахматам чемпионов Ли Седоля. Какая компания разработала ИИ AlphaGo?
    • Google
  9. В Big Data возможны…
    • разные типы и области происхождения данных
  10. В Big Data не акцентируется…
    • Voicing (Озвучивание)
  11. В базе данных есть следующие записи: длительность звонков, общее число звонков, общее число переданных сообщений, количество потраченных гигабайтов трафика. Вы хотите предсказывать объем трафика, который потратят клиенты. Что будет объектом модели в этой задаче?
    • Клиент
  12. В какие игры нейросеть еще не научилась обыгрывать человека?
    • Бридж
  13. В каком году впервые был введен термин Большие данные?
    • 2008
  14. В каком из приведённых примеров наиболее эффективны NoSQL решения типа ключ-значение?
    • потоковая обработка логов кластера серверов и быстрого сохранения без требования оперативной аналитики
  15. В краудсорсинге вклад в проект каждого участника осуществляется…
    • ресурсами – компьютер, время и др.
  16. В краудсорсинге могут быть задействованы…
    • профессионалы и любители
  17. В любых Big Data информация целиком распределена…
    • по всей сети
  18. В результате использования инструментов Data Mining пользователь может …
    • Получить подтверждение или опровержение гипотез, выдвинутых пользователем
  19. В чём преимущество колоночно-ориентированных СУБД?
    • они имеют более гибкие возможности аналитики
  20. Вы взяли среднесуточные температуры за последние два года и построили регрессионную модель для прогнозирования дневного спроса на товары. Для мороженого она работает хорошо, а для шуб плохо. Почему?
    • Шубы продают нечасто — мало данных
  21. Выберите верное высказывание…
    • проблема больших данных – это такая проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна
  22. Выберите неверное высказывание про MapReduce…
    • MapReduce был придуман разработчиками Hadoop
  23. Выберите неверное высказывание…
    • большие данные – это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров
  24. Выберите технологию потоковой обработки событий в режиме реального времени
    • Apache Kafka
    • Spark Streaming
  25. Горизонтальная масштабируемость при обработке Big Data – это…
    • увеличение скорости обработки при росте объема данных
  26. Дайте определение Big Data
    • Комплексный набор подходов, инструментов и методов обработки структурированных и неструктурированных данных колоссальных объемов
  27. Дайте определение Map Reduce…
    • Модель распределенных вычислений, предназначенная для параллельных вычислений над очень большими (до нескольких петабайт) объемами данных
  28. Данные могут быть получены в результате...
    • Измерений
    • Экспериментов
    • Арифметических и логических операций
  29. Данные представляют собой...
    • Факты и графики
    • Текст
    • Картинки, звуки, аналоговые или цифровые видео-сегменты
  30. Для машинного обучения подходят данные…
    • Любых форматов в цифровом виде
    • Предварительно подготовленные, очищенные от ошибок, пропусков и выбросов, а также нормализованные и представленные в виде числовых векторов
  31. Для обработки больших данных наиболее актуально…
    • привлечь больше вычислительных мощностей для обработки
    • ускорить обработку или увеличить объем обрабатываемых данных
  32. До появления Big Data невозможно было…
    • обрабатывать всю вузовскую информацию полностью
    • работать с данными дистанционного зондирования Земли
  33. До появления Data Mining невозможно было найти связи…
    • студентов вуза и их успеваемости по предмету
    • рекламирования и покупательской активности на сайте веб-магазина
  34. Допустим, нам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения нам в этом пригодится?
    • Компьютерное зрение
  35. Закончите следующее предложение: "С точки зрения машины, информация становится структурированной, если...
    • Машина проинструктирована, каким образом её обрабатывать
  36. Изначально Big Data применяли лишь в…
    • академической среде
  37. Интеллектуальный анализ данных или Data Mining…
    • Информация, которая организована и проанализирована с целью сделать ее понятной и применимой для решения задачи или принятия решений.
  38. Искусственные нейронные сети (ИНС) — модели машинного обучения, использующие комбинации распределенных простых операций, зависящих от обучаемых параметров, для обработки входных данных. Какого вида ИНС не существует?
    • Наивные
  39. Итак, вы решили работать с большими данными. Какой из этих инструментов вам вряд ли пригодится?
    • Texmaker
  40. Как происходит обучение нейронной сети?
    • сеть запускается на обучающем множестве, и подстраиваются весовые значения
  41. Какая компания создала технологию MapReduce?
    • Google
  42. Какая информация о пациентах, находящаяся в распоряжении медицинской организации, относится к персональным данным?
    • Диагнозы конкретных пациентов
    • Данные из электронной медицинской карты без Ф.И.О.: дата рождения, адрес регистрации и пр.
  43. Какая компания создала технологию MapReduce?
    • Google
  44. Какие задачи решают графовые БД?
    • встроенная обработка данных сетевыми методами
  45. Какие из задач решаются Big Data?
    • Все вышеперечисленное
  46. Какие из следующих технологий СУБД не используют принцип MapReduce?
    • Cassandra
    • Redis
  47. Какие модули по умолчанию входят в состав проекта Apache Hadoop?
    • HDFS
    • MapReduce
    • YARN
  48. Какое API было добавлено в Hadoop v2.0?
    • YARN
  49. Какое из нижеперечисленных понятий не относится к перечню необходимых критериев для создания проекта, связанного с Большими данными?
    • Географическое положение
  50. Какой тип NoSQL решения наиболее эффективен для потоковой обработки логов кластера серверов и быстрого сохранения без требования оперативной аналитики?
    • ключ-значение
  51. Какой язык программирования из перечисленных является наиболее важным для аналитика?
    • R
  52. Краудсорсинг – модель привлечения…
    • неограниченного числа и потенциала участников
  53. Краудсорсинг большого проекта невозможен без…
    • декомпозиции
  54. Кто ввел термин Большие данные?
    • Клиффорд Линч
  55. Кто и в каком году впервые ввел термин «Big Data»?
    • Клиффорд Линч, редактор журнала Nature, в 2008 году
  56. Локальность данных Big Data – это…
    • время коммуникации не может быть выше времени обработки
  57. На каком языке программирования можно разрабатывать приложения Hadoop MapReduce?
    • Практически на любом: Java, C++ и другие компилируемые языки
  58. На основе какого языка был создан R?
    • S
  59. Недостатком краудсорсинга является…
    • ограниченная мотивация
  60. Нейросети хорошо проявляют себя не только в распознавании, но и в генерации изображений. Но кое с чем у них все-таки возникают проблемы. С чем именно?
    • Текстуры
  61. Обрабатывать большие данные (Big Data) лет десять назад мешали…
    • недостаточные вычислительные мощности
  62. Одна из главных целей Big Data – это…
    • нижение издержек операций
  63. Одна из главных целей Data Mining – это получение…
    • связей малых выборок данных, распространение их на большие массивы
  64. Основными достоинствами краудсорсинга являются…
    • оперативность реализации проекта и распределения прибыли
  65. Особых успехов нейросети достигли в работе с изображениями. Но что из этого нейросети не могут сделать?
    • Догадаться, что вы нарисовали
  66. Отказоустойчивость Big Data – это, когда…
    • сбой в одном звене системы не ведет к сбоям в других звеньях
  67. Отметьте верное понимание Variety в контексте характеристик Big Data…
    • разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
  68. Отметьте причину создания NoSQL баз данных…
    • высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности
  69. Перечислите четыре основных характеристики Big Data…
    • Variety, Velocity, Volume, Value
  70. Подходы к построению моделей Data Mining
    • статистический и на основании машинного обучения
  71. Пример благоразумного использования Hadoop…
    • посекундное сохранение данных температуры, поступающих со всех городов России (по одному показанию на город, всего городов 1100 шт)
  72. Примером применения Big Data не может быть…
    • родительский контроль
  73. Принцип 3Vs расшифровывается как...
    • Volume, Variety, Velocity
  74. Принципом Big Data не является…
    • локализация данных
  75. Расписание движения поездов может рассматриваться как пример…
    • Табличной модели
  76. С помощью Big Data клиентский компьютер может обрабатывать до…
    • терабайтов данных
  77. Сколько Петабайт в Зеттабайте?
    • 1024
  78. Специалист по работе с данными знает и умеет многое, но нельзя знать всего. Чего не преподают на курсах по Data Science?
    • Масс-спектрометрия
  79. Теперь вам нужно обучить нейросеть распознавать на фото воздушные шары. Коллега предлагает перевести все изображения для обучения нейросети в черно-белые. Что вы ответите?
    • Нет, потому что это ухудшит результат
  80. Традиционные методы визуализации могут находить следующее применение…
    • Представлять пользователю информацию в наглядном виде
    • Компактно описывать закономерности, присущие исходному набору данных
  81. Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?
    • хранить данные с изменяющейся структурой
  82. Чем глубокое обучение отличается от машинного?
    • Машинное обучение изучает алгоритмы, обучающиеся без использования специального свода правил, а глубокое обучение — это машинное обучение нейронных сетей с более чем тремя скрытыми слоями нейронов
  83. Чем искусственная нейронная сеть похожа на естественные нейронные сети в мозге?
    • Их объединяет лишь общий принцип построения: это последовательность связанных друг с другом нейронов
  84. Что будет объектом в задаче поиска уходящих от компании клиентов?
    • Клиент
  85. Что из перечисленного помогает следить за эволюцией документа, над созданием которого работает одновременно большое количество авторов?
    • Исторический поток
  86. Что из этого не является типом визуализации?
    • Текст
  87. Что не является целью процесса Business Intelligence?
    • Модификация существующего программного обеспечения
  88. Что необходимо выполнить, чтобы нейросеть могла помочь в формировании решения…
    • Обучить на примерах
  89. Что означает термин «Big Data» в информационных технологиях?
    • Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
  90. Что означает термин «Business Intelligence» в информационных технологиях?
    • Методы и инструменты для перевода необработанной информации в осмысленную, удобную для восприятия форму
  91. Что означает термин NoSQL?
    • Не только SQL
  92. Что такое EDA?
    • Исследовательский анализ данных
  93. Что такое Spark?
    • Технология распределенных вычислений
  94. Что такое SQL?
    • Язык структурированных запросов
  95. Что такое БУСТИНГ?
    • Построение ансамбля моделей машинного обучения
  96. Эффективно применять Data Mining с целью защиты от…
    • мошенников