Что р: Что такое р/с и к/с в банковских реквизитах?

Содержание

Объясняем p-значения для начинающих Data Scientist’ов / Хабр

Я помню, когда я проходил свою первую зарубежную стажировку в CERN в качестве практиканта, большинство людей все еще говорили об открытии бозона Хиггса после подтверждения того, что он соответствует порогу «пять сигм» (что означает наличие p-значения 0,0000003).

Тогда я ничего не знал о p-значении, проверке гипотез или даже статистической значимости.

Я решил загуглить слово — «p-значение», и то, что я нашел в Википедии, заставило меня еще больше запутаться…

При проверке статистических гипотез p-значение или значение вероятности для данной статистической модели — это вероятность того, что при истинности нулевой гипотезы статистическая сводка (например, абсолютное значение выборочной средней разницы между двумя сравниваемыми группами) будет больше или равна фактическим наблюдаемым результатам.
— Wikipedia

Хорошая работа, Википедия.

Ладно. Я не понял, что на самом деле означает р-значение.

Углубившись в область науки о данных, я наконец начал понимать смысл p-значения и то, где его можно использовать как часть инструментов принятия решений в определенных экспериментах.

Поэтому я решил объяснить р-значение в этой статье, а также то, как его можно использовать при проверке гипотез, чтобы дать вам лучшее и интуитивное понимание р-значений.

Также мы не можем пропустить фундаментальное понимание других концепций и определение p-значения, я обещаю, что сделаю это объяснение интуитивно понятным, не подвергая вас всеми техническими терминами, с которыми я столкнулся.

Всего в этой статье четыре раздела, чтобы дать вам полную картину от построения проверки гипотезы до понимания р-значения и использования его в процессе принятия решений. Я настоятельно рекомендую вам пройтись по всем из них, чтобы получить подробное понимание р-значений:

  1. Проверка гипотезы
  2. Нормальное распределение
  3. Что такое P-значение?
  4. Статистическая значимость

Это будет весело.

Давайте начнем!

1. Проверка гипотез


Прежде чем мы поговорим о том, что означает р-значение, давайте начнем с разбора проверки гипотез, где р-значение используется для определения статистической значимости наших результатов.

Наша конечная цель — определить статистическую значимость наших результатов.

И статистическая значимость построена на этих 3 простых идеях:

  • Проверка гипотезы
  • Нормальное распределение
  • P-значение

Проверка гипотез используется для проверки обоснованности утверждения (нулевой гипотезы), сделанного в отношении совокупности с использованием выборочных данных. Альтернативная гипотеза — это та, в которую вы бы поверили, если бы нулевая гипотеза оказалась неверной.

Другими словами, мы создадим утверждение (нулевая гипотеза) и используем пример данных, чтобы проверить, является ли утверждение действительным. Если утверждение не соответствует действительности, мы выберем альтернативную гипотезу. Все очень просто.

Чтобы узнать, является ли утверждение обоснованным или нет, мы будем использовать p-значение для взвешивания силы доказательств, чтобы увидеть, является ли оно статистически значимым. Если доказательства подтверждают альтернативную гипотезу, то мы отвергнем нулевую гипотезу и примем альтернативную гипотезу. Это будет объяснено в следующем разделе.

Давайте воспользуемся примером, чтобы сделать эту концепцию более ясной, и этот пример будет использоваться на протяжении всей этой статьи для других концепций.

Пример. Предположим, что в пиццерии заявлено, что время их доставки составляет в среднем 30 минут или меньше, но вы думаете, что оно больше чем заявленное. Таким образом, вы проводите проверку гипотезы и случайным образом выбираете время доставки для проверки утверждения:

  • Нулевая гипотеза — среднее время доставки составляет 30 минут или меньше
  • Альтернативная гипотеза — среднее время доставки превышает 30 минут
  • Цель здесь состоит в том, чтобы определить, какое утверждение — нулевое или альтернативное — лучше подтверждается данными, полученными из наших выборочных данных.

Мы будем использовать односторонний тест в нашем случае, так как нам важно только, чтобы среднее время доставки превышало 30 минут. Мы не будем учитывать эту возможность в другом направлении, поскольку последствия того, что среднее время доставки будет меньше или равно 30 минутам, еще более предпочтительны. Здесь мы хотим проверить, есть ли вероятность того, что среднее время доставки превышает 30 минут. Другими словами, мы хотим посмотреть, не обманула ли нас пиццерия.

Одним из распространенных способов проверки гипотез является использование Z-критерия. Здесь мы не будем вдаваться в подробности, так как хотим лучше понять, что происходит на поверхности, прежде чем погрузиться глубже.

2. Нормальное распределение


Нормальное распределение — это функция плотности вероятности, используемая для просмотра распределения данных.

Нормальное распределение имеет два параметра — среднее (μ) и стандартное отклонение, также называемое сигма (σ).

Среднее — это центральная тенденция распределения. Оно определяет местоположение пика для нормальных распределений. Стандартное отклонение — это мера изменчивости. Оно определяет, насколько далеко от среднего значения склонны падать значения.

Нормальное распределение обычно связано с правилом 68-95-99.7 (изображение выше).

  • 68% данных находятся в пределах 1 стандартного отклонения (σ) от среднего значения (μ)
  • 95% данных находятся в пределах 2 стандартных отклонений (σ) от среднего значения (μ)
  • 99,7% данных находятся в пределах 3 стандартных отклонений (σ) от среднего значения (μ)

Помните порог «пять сигм» для открытия бозона Хиггса, о котором я говорил в начале? 5 сигм — это около 99,99999426696856% данных, которые должны быть попасть до того, как ученые подтвердили открытие бозона Хиггса. Это был строгий порог, установленный, чтобы избежать любых возможных ложных сигналов.

Классно. Теперь вы можете задаться вопросом: «Как нормальное распределение относится к нашей предыдущей проверке гипотез?»

Поскольку мы использовали Z-тест для проверки нашей гипотезы, нам нужно вычислить Z-баллы (которые будут использоваться в нашей тестовой статистике), которые представляют собой число стандартных отклонений от среднего значения точки данных. В нашем случае каждая точка данных — это время доставки пиццы, которое мы получили.

Обратите внимание, что когда мы рассчитали все Z-баллы для каждого времени доставки пиццы и построили стандартную кривую нормального распределения, как показано ниже, единица измерения на оси X изменится с минут на единицу стандартного отклонения, так как мы стандартизировали переменную, вычитая среднее и деля его на стандартное отклонение (см. формулу выше).

Изучение стандартной кривой нормального распределения полезно, потому что мы можем сравнить результаты теста с ”нормальной» популяцией со стандартизированной единицей в стандартном отклонении, особенно когда у нас есть переменная, которая поставляется с различными единицами.

Z-оценка может сказать нам, где лежат общие данные по сравнению со средней популяцией.

Мне нравится, как Уилл Кёрсен выразился: чем выше или ниже Z-показатель, тем менее вероятным будет случайный результат и тем более вероятным будет значимый результат.

Но насколько высокий (или низкий) показатель считается достаточно убедительным, чтобы количественно оценить, насколько значимы наши результаты?

Кульминация

Здесь нам нужен последний элемент для решения головоломки — p-значение, и проверить, являются ли наши результаты статистически значимыми на основе уровня значимости (также известного как альфа), который мы установили перед началом нашего эксперимента.

3. Что такое P-значение?


Наконец… Здесь мы говорим о р-значении!

Все предыдущие объяснения предназначены для того, чтобы подготовить почву и привести нас к этому P-значению. Нам нужен предыдущий контекст и шаги, чтобы понять это таинственное (на самом деле не столь таинственное) р-значение и то, как оно может привести к нашим решениям для проверки гипотезы.

Если вы зашли так далеко, продолжайте читать. Потому что этот раздел — самая захватывающая часть из всех!

Вместо того чтобы объяснять p-значения, используя определение, данное Википедией (извини Википедия), давайте объясним это в нашем контексте — время доставки пиццы!

Напомним, что мы произвольно отобрали некоторые сроки доставки пиццы, и цель состоит в том, чтобы проверить, превышает ли время доставки 30 минут. Если окончательные доказательства подтверждают утверждение пиццерии (среднее время доставки составляет 30 минут или меньше), то мы не будем отвергать нулевую гипотезу. В противном случае мы опровергаем нулевую гипотезу.

Поэтому задача p-значения — ответить на этот вопрос:

Если я живу в мире, где время доставки пиццы составляет 30 минут или меньше (нулевая гипотеза верна), насколько неожиданными являются мои доказательства в реальной жизни?

Р-значение отвечает на этот вопрос числом — вероятностью.

Чем ниже значение p, тем более неожиданными являются доказательства, тем более нелепой выглядит наша нулевая гипотеза.

И что мы делаем, когда чувствуем себя нелепо с нашей нулевой гипотезой? Мы отвергаем ее и выбираем нашу альтернативную гипотезу.

Если р-значение ниже заданного уровня значимости (люди называют его альфа, я называю это порогом нелепости — не спрашивайте, почему, мне просто легче понять), тогда мы отвергаем нулевую гипотезу.

Теперь мы понимаем, что означает p-значение. Давайте применим это в нашем случае.

P-значение в расчете времени доставки пиццы

Теперь, когда мы собрали несколько выборочных данных о времени доставки, мы выполнили расчет и обнаружили, что среднее время доставки больше на 10 минут с p-значением 0,03.

Это означает, что в мире, где время доставки пиццы составляет 30 минут или меньше (нулевая гипотеза верна), есть 3% шанс, что мы увидим, что среднее время доставки, по крайней мере, на 10 минут больше, из-за случайного шума.

Чем меньше p-значение, тем более значимым будет результат, потому что он с меньшей вероятностью будет вызван шумом.

В нашем случае большинство людей неправильно понимают р-значение:

Р-значение 0,03 означает, что есть 3% (вероятность в процентах), что результат обусловлен случайностью — что не соответствует действительности.

Люди часто хотят получить определенный ответ (в том числе и я), и именно поэтому я долго путался с интерпретацией p-значений.

Р-значение ничего не *доказывает*. Это просто способ использовать неожиданность в качестве основы для принятия разумного решения.
— Кэсси Козырков

Вот как мы можем использовать p-значение 0,03, чтобы помочь нам принять разумное решение (ВАЖНО):

  • Представьте, что мы живем в мире, где среднее время доставки всегда составляет 30 минут или меньше — потому что мы верим в пиццерию (наше первоначальное убеждение)!
  • После анализа времени доставки собранных образцов р-значение на 0,03 ниже, чем уровень значимости 0,05 (предположим, что мы установили это значение перед нашим экспериментом), и мы можем сказать, что результат является статистически значимым.
  • Поскольку мы всегда верили пиццерии, что она может выполнить свое обещание доставить пиццу за 30 минут или меньше, нам теперь нужно подумать, имеет ли это убеждение смысл, поскольку результат говорит нам о том, что пиццерия не выполняет свое обещание и результат является статистически значимым.
  • Так что же нам делать? Сначала мы пытаемся придумать любой возможный способ сделать наше первоначальное убеждение (нулевая гипотеза) верным. Но поскольку пиццерия постепенно получает плохие отзывы от других людей и часто приводит плохие оправдания, которые привели к задержке доставки, даже мы сами чувствуем себя нелепо, чтобы оправдать пиццерию, и, следовательно, мы решаем отвергнуть нулевую гипотезу.
  • Наконец, следующее разумное решение — не покупать больше пиццы в этом месте.

К настоящему времени вы, возможно, уже что-то поняли… В зависимости от нашего контекста, p-значения не используются, чтобы что-либо доказать или оправдать.

По моему мнению, p-значения используются в качестве инструмента для оспаривания нашего первоначального убеждения (нулевая гипотеза), когда результат является статистически значимым. В тот момент, когда мы чувствуем себя нелепо с нашим собственным убеждением (при условии, что р-значение показывает, что результат статистически значим), мы отбрасываем наше первоначальное убеждение (отвергаем нулевую гипотезу) и принимаем разумное решение.

4. Статистическая значимость

Наконец, это последний этап, когда мы собираем все вместе и проверяем, является ли результат статистически значимым.

Недостаточно иметь только р-значение, нам нужно установить порог (уровень значимости — альфа). Альфа всегда должна быть установлена ​​перед экспериментом, чтобы избежать смещения. Если наблюдаемое р-значение ниже, чем альфа, то мы заключаем, что результат является статистически значимым.

Основное правило — установить альфа равным 0,05 или 0,01 (опять же, значение зависит от вашей задачи).

Как упоминалось ранее, предположим, что мы установили альфа равным 0,05, прежде чем мы начали эксперимент, полученный результат является статистически значимым, поскольку р-значение 0,03 ниже, чем альфа.

Для справки ниже приведены основные этапы всего эксперимента:

  1. Сформулируйте нулевую гипотезу
  2. Сформулируйте альтернативную гипотезу
  3. Определите значение альфа для использования
  4. Найдите Z-показатель, связанный с вашим альфа-уровнем
  5. Найдите тестовую статистику, используя эту формулу
  6. Если значение тестовой статистики меньше Z-показателя альфа-уровня (или p-значение меньше альфа-значения), отклоните нулевую гипотезу. В противном случае не отвергайте нулевую гипотезу.

Если вы хотите узнать больше о статистической значимости, не стесняйтесь посмотреть эту статью — Объяснение статистической значимости, написанная Уиллом Керсеном.

Последующие размышления

Здесь много чего нужно переваривать, не так ли?

Я не могу отрицать, что p-значения по своей сути сбивают с толку многих людей, и мне потребовалось довольно много времени, чтобы по-настоящему понять и оценить значение p-значений и то, как они могут быть применены в рамках нашего процесса принятия решений в качестве специалистов по данным.

Но не слишком полагайтесь на p-значения, поскольку они помогают только в небольшой части всего процесса принятия решений.

Я надеюсь, что мое объяснение p-значений стало интуитивно понятным и полезным в вашем понимании того, что в действительности означают p-значения и как их можно использовать при проверке ваших гипотез.

Сам по себе расчет р-значений прост. Трудная часть возникает, когда мы хотим интерпретировать p-значения в проверке гипотез. Надеюсь, что теперь трудная часть станет для вас немного легче.

Если вы хотите узнать больше о статистике, я настоятельно рекомендую вам прочитать эту книгу (которую я сейчас читаю!) — Практическая статистика для специалистов по данным, специально написанная для data scientists, чтобы разобраться с фундаментальными концепциями статистики.

Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя платные онлайн-курсы SkillFactory:

  • Обучение профессии Data Science с нуля (12 месяцев)
  • Профессия аналитика с любым стартовым уровнем (9 месяцев)
  • Курс по Machine Learning (12 недель)
  • Курс «Python для веб-разработки» (9 месяцев)
  • Курс по DevOps (12 месяцев)
  • Профессия Веб-разработчик (8 месяцев)

Читать еще


  • Тренды в Data Scienсe 2020
  • Data Science умерла. Да здравствует Business Science
  • Крутые Data Scientist не тратят время на статистику
  • Как стать Data Scientist без онлайн-курсов
  • 450 бесплатных курсов от Лиги Плюща
  • Data Science для гуманитариев: что такое «data»
  • Data Scienсe на стероидах: знакомство с Decision Intelligence

Список утвержденных сокращений адресообразующих элементов

Классификатор адресов России — Федеральная информационная адресная система (ФИАС)
база адресов, разработанная Федеральной налоговой службой. Включает в себя почтовые индексы, коды ОКАТО и ИФНС, названия районов, городов и улиц. По адресу позволяет определить индекс и код ОКАТО конкретного объекта. И наоборот по индексу или коду ОКАТО найти адрес.


Список утвержденных сокращений адресообразующих элементов


Есть вопросы? Мы готовы помочь вам!


Составление ФИАС и внесение в него изменений находится в ведении ФНС России.

Компания «Альта-Софт» получает информацию с официального сайта ГНИВЦ ФНС России.

В соответствии с положениями Федерального закона от 28.12.2013 № 443-ФЗ «О федеральной информационной адресной системе и о внесении изменений в Федеральный закон «Об общих принципах организации местного самоуправления в Российской Федерации», при отсутствии адреса в ФИАС (ФИАС) необходимо обратиться в органы местного самоуправления (органы государственной власти субъектов Российской Федерации), имеющие полномочия на присвоение адреса объектам адресации, а также на размещение, изменение и аннулирование сведений об адресах в государственном адресном реестре.

В соответствии с Приказом Минфина России от 5 ноября 2015 г. N 171н «Об утверждении Перечня элементов планировочной структуры, элементов улично-дорожной сети, элементов объектов адресации, типов зданий (сооружений), помещений, используемых в качестве реквизитов адреса, и Правил сокращенного наименования адресообразующих элементов».

Полное наименование Сокращенное наименование
Субъекты Российской Федерации
Республика респ.
Край край
Область обл.
Город федерального значения г.ф.з.
Автономная область а.обл.
Автономный округ а.окр.
Муниципальные образования
Муниципальный район м.р-н
Городской округ г.о.
Городское поселение г. п.
Сельское поселение с.п.
Внутригородской район вн.р-н
Внутригородская территория (внутригородское муниципальное образование) города федерального значения вн.тер.г.
Административно-территориальные единицы
Поселение пос.
Район р-н
Сельсовет с/с
Населенные пункты
Город г.
Поселок городского типа пгт.
Рабочий поселок рп.
Курортный поселок кп.
Городской поселок гп.
Поселок п.
Аал аал
Арбан арбан
Аул аул
Выселки в-ки
Городок г-к
Заимка з-ка
Починок п-к
Кишлак киш.
Поселок при станции (поселок станции) п. ст. 
Поселок при железнодорожной станции п. ж/д ст. 
Железнодорожный блокпост ж/д бл-ст
Железнодорожная будка ж/д б-ка
Железнодорожная ветка ж/д в-ка
Железнодорожная казарма ж/д к-ма
Железнодорожный комбинат ж/д к-т
Железнодорожная платформа ж/д пл-ма
Железнодорожная площадка ж/д пл-ка
Железнодорожный путевой пост ж/д п.п.
Железнодорожный остановочный пункт ж/д о.п.
Железнодорожный разъезд ж/д рзд.
Железнодорожная станция ж/д ст. 
Местечко м-ко
Деревня д.
Село с.
Слобода сл.
Станция ст. 
Станица ст-ца
Улус у.
Хутор х.
Разъезд рзд.
Зимовье зим.
Элементы планировочной структуры
Берег б-г
Вал вал
Жилой район ж/р
Зона (массив) зона
Квартал кв-л
Микрорайон мкр.
Остров ост-в
Парк парк
Платформа платф.
Промышленный район п/р
Район р-н
Сад сад
Сквер сквер
Территория тер.
Территория садоводческих некоммерческих объединений граждан тер. СНО
Территория огороднических некоммерческих объединений граждан тер. ОНО
Территория дачных некоммерческих объединений граждан тер. ДНО
Территория садоводческих некоммерческих товариществ тер. СНТ
Территория огороднических некоммерческих товариществ тер. ОНТ
Территория дачных некоммерческих товариществ тер. ДНТ
Территория садоводческих потребительских кооперативов тер. СПК
Территория огороднических потребительских кооперативов тер. ОПК
Территория дачных потребительских кооперативов тер. ДПК
Территория садоводческих некоммерческих партнерств тер. СНП
Территория огороднических некоммерческих партнерств тер. ОНП
Территория дачных некоммерческих партнерств тер. ДНП
Территория товарищества собственников недвижимости тер. ТСН
Территория гаражно-строительного кооператива тер. ГСК
Усадьба ус.
Территория фермерского хозяйства тер.ф.х.
Юрты ю.
Элементы улично-дорожной сети
Аллея ал.
Бульвар б-р
Взвоз взв.
Въезд взд.
Дорога дор.
Заезд ззд.
Километр км
Кольцо к-цо
Коса коса
Линия лн.
Магистраль мгстр.
Набережная наб.
Переезд пер-д
Переулок пер.
Площадка пл-ка
Площадь пл.
Проезд пр-д
Просек пр-к
Просека пр-ка
Проселок пр-лок
Проспект пр-кт
Проулок проул.
Разъезд рзд.
Ряд(ы) ряд
Сквер с-р
Спуск с-к
Съезд сзд.
Тракт тракт
Тупик туп.
Улица ул.
Шоссе ш.
Идентификационные элементы объекта адресации
Владение влд.
Гараж г-ж
Дом д.
Домовладение двлд.
Здание зд.
Земельный участок з/у
Квартира кв.
Комната ком.
Подвал подв.
Котельная кот.
Погреб п-б
Корпус к.
Объект незавершенного строительства ОНС
Офис офис
Павильон пав.
Помещение помещ.
Рабочий участок раб.уч.
Склад скл.
Сооружение coop.
Строение стр.
Торговый зал торг.зал
Цех цех

Р.Младич заявил, что за его арестом стоят американцы — РБК

www.adv.rbc.ru

www.adv.rbc.ru

www.adv.rbc.ru

Скрыть баннеры

Ваше местоположение ?

ДаВыбрать другое

Рубрики

Курс евро на 5 октября
EUR ЦБ: 56,17 (+1,78) Инвестиции, 04 окт, 16:13

Курс доллара на 5 октября
USD ЦБ: 58,79 (+1,22) Инвестиции, 04 окт, 16:13

Когда вместо косметолога лучше идти к пластическому хирургу Pro, 15:34

Минобороны сообщило об уничтожении ангара с «Байраткарами» под Николаевым Политика, 15:26

Минобороны заявило об атаке превосходящих сил на Криворожском направлении Политика, 15:23

www. adv.rbc.ru

www.adv.rbc.ru

КС России вышел из Всемирной конференции по конституционному правосудию Политика, 15:16

Как улучшить здравоохранение в России за счет медицинского туризма Партнерский проект, 15:15

Мэр Донецка сообщил о гибели двух людей из-за обстрелов Политика, 15:00

Роскомнадзор назвал причину блокировки криптобиржи OKX Крипто, 14:58

Объясняем, что значат новости

Вечерняя рассылка РБК

Подпишитесь за 99 ₽ в месяц

Кремль назвал Пригожина «болеющим душой за происходящее» бизнесменом Политика, 14:53

Любые цифры и буквы: как водителям выделиться необычным автономером Партнерский проект, 14:52

Литва отложила демонтаж советского мемориала после вмешательства ООН Политика, 14:52

Maer запустил крупный 3D-медиафасад на Третьем транспортном кольце Пресс-релиз, 14:51

Акции АЛРОСА взлетели на 7% на фоне исключения из санкционного списка Инвестиции, 14:50

Курс доллара вновь превысил ₽60 Инвестиции, 14:48

Щербакова и Загитова будут вести шоу «Ледниковый период» Спорт, 14:46

www. adv.rbc.ru

www.adv.rbc.ru

www.adv.rbc.ru

Бывший генерал армии Республики Сербской Ратко Младич, который ожидает суда за военные преступления, совершенные им на территории Боснии и Герцеговины, считает, что за его арестом стоят американцы. Его слова передал газете «Вечерне новости» сосед генерала по деревне Лазареов Ненад Йоцович.

Когда в дом Бранислава, родственника Р.Младича, у которого том проживал, пришли полицейские, генерал поинтересовался у них, где тот американец, ради которого «все это делается». Ему ответили, что американцев здесь нет, на что Р.Младич заметил, что есть и что «без них здесь ничего не делается».

По свидетельству Н.Йоцовича, во время задержания генерал вспоминал о поездке в Россию, которую он посетил, будучи офицером Югославской народной армии. Р.Младич рассказал, что был в заведениях, где обучались русские офицеры, и «за ним никто не следил». По его словам, «русские знают, кому можно подать руку и после этого не пересчитывать пальцы».

Пока в доме его родственника шел обыск, генерал говорил о том, что все «сдано и продано», имея в виду, в частности, объявивший о независимости край Косово. Р.Младич также рассказал, что задумывался о самоубийстве, но потом счел этот поступок несправедливым по отношению к своей семье.

Напомним, Р.Младич был арестован 26 мая 2011г. сербской полицией. Он обвиняется Международным трибуналом по военным преступлениям в бывшей Югославии в организации этнических чисток в ходе боснийской войны 1992-1995гг. Арест Р.Младича является одним из главных условий вступления Сербии в Евросоюз. Прокурор МТБЮ заявил, что хотел бы видеть Р.Младича на скамье подсудимых вместе с его политическим покровителем – бывшим президентом Республики Сербской Радованом Караджичем.

Следите за новостями РБК в социальных сетях:

Что это такое, как его рассчитать и почему это важно

Что такое P-значение?

В статистике p-значение – это вероятность получения результатов, по крайней мере столь же экстремальных, как и наблюдаемые результаты проверки статистической гипотезы, при условии, что нулевая гипотеза верна. Значение p служит альтернативой точкам отклонения, чтобы обеспечить наименьший уровень значимости, при котором нулевая гипотеза будет отклонена. Меньшее значение p означает, что есть более сильные доказательства в пользу альтернативной гипотезы.

Р-значение часто используется для повышения доверия к исследованиям или отчетам государственных органов. Например, Бюро переписи США требует, чтобы любой анализ с p-значением, превышающим 0,10, должен сопровождаться заявлением о том, что разница статистически не отличается от нуля. различные публикации.

Ключевые выводы

  • Значение p — это статистическое измерение, используемое для проверки гипотезы на основе наблюдаемых данных.
  • Значение p измеряет вероятность получения наблюдаемых результатов при условии, что нулевая гипотеза верна.
  • Чем ниже p-значение, тем выше статистическая значимость наблюдаемой разницы.
  • Значение p 0,05 или ниже обычно считается статистически значимым.
  • P-значение может служить альтернативой или дополнением к предварительно выбранным уровням достоверности для проверки гипотез.
Нажмите «Воспроизвести», чтобы узнать, как рассчитывается P-значение

Как рассчитывается P-значение?

P-значения обычно находятся с помощью таблиц p-значений или электронных таблиц/статистического программного обеспечения. Эти расчеты основаны на предполагаемом или известном распределении вероятностей конкретной тестируемой статистики. P-значения рассчитываются из отклонения между наблюдаемым значением и выбранным эталонным значением с учетом распределения вероятностей статистики, при этом большая разница между двумя значениями соответствует более низкому p-значению.

Математически p-значение рассчитывается с использованием интегрального исчисления на основе площади под кривой распределения вероятностей для всех значений статистики, которые по крайней мере так же далеки от эталонного значения, как и наблюдаемое значение, относительно общей площади под кривой распределения вероятностей. .

Расчет p-значения зависит от типа проведенного теста. Три типа тестов описывают положение на кривой распределения вероятностей: тест с более низким хвостом, тест с верхним хвостом или двусторонний тест.

Короче говоря, чем больше разница между двумя наблюдаемыми значениями, тем меньше вероятность того, что разница вызвана простой случайностью, и это отражается в более низком p-значении.

Подход P-значения к проверке гипотез

Подход p-значения к проверке гипотезы использует рассчитанную вероятность, чтобы определить, есть ли основания отвергать нулевую гипотезу. Нулевая гипотеза, также известная как «гипотеза», представляет собой исходное утверждение о совокупности (или процессе генерации данных). Альтернативная гипотеза утверждает, отличается ли параметр совокупности от значения параметра совокупности, указанного в гипотезе.

На практике уровень значимости указывается заранее, чтобы определить, насколько малым должно быть p-значение, чтобы отвергнуть нулевую гипотезу. Поскольку разные исследователи используют разные уровни значимости при изучении вопроса, у читателя иногда могут возникнуть трудности со сравнением результатов двух разных тестов. P-значения обеспечивают решение этой проблемы.

Например, предположим, что исследование, сравнивающее доходность двух конкретных активов, было проведено разными исследователями, которые использовали одни и те же данные, но с разными уровнями значимости. Исследователи могут прийти к противоположным выводам относительно того, различаются ли активы.

Если бы один исследователь использовал уровень достоверности 90 %, а другой требовал уровень достоверности 95 %, чтобы отвергнуть нулевую гипотезу, а p-значение наблюдаемой разницы между двумя доходами составляло 0,08 (соответствует уровню достоверности 92 %). , то первый исследователь обнаружит, что два актива имеют статистически значимую разницу, в то время как второй не обнаружит статистически значимой разницы между доходностью.

Чтобы избежать этой проблемы, исследователи могли бы сообщить p-значение проверки гипотезы и позволить читателям самим интерпретировать статистическую значимость. Это называется подходом p-значения к проверке гипотез. Независимые наблюдатели могли бы отметить значение p и решить для себя, представляет ли это статистически значимую разницу или нет.

Даже низкое значение p не обязательно является доказательством статистической значимости, так как все еще существует вероятность того, что наблюдаемые данные являются результатом случайности. Только повторные эксперименты или исследования могут подтвердить, является ли связь статистически значимой.

Пример значения P

Инвестор утверждает, что эффективность его инвестиционного портфеля эквивалентна эффективности индекса Standard & Poor’s (S&P) 500. Чтобы определить это, инвестор проводит двусторонний тест.

Нулевая гипотеза утверждает, что доходность портфеля эквивалентна доходности S&P 500 за определенный период, в то время как альтернативная гипотеза утверждает, что доходность портфеля и доходность S&P 500 не эквивалентны — если инвестор провел односторонний тест, альтернативный Гипотеза будет утверждать, что доходность портфеля либо меньше, либо больше, чем доходность S&P 500.

Тест гипотезы p-значения не обязательно использует предварительно выбранный уровень достоверности, при котором инвестор должен сбросить нулевую гипотезу о том, что доходность эквивалентна. Вместо этого он обеспечивает меру того, сколько доказательств есть, чтобы отвергнуть нулевую гипотезу. Чем меньше p-значение, тем больше доказательств против нулевой гипотезы.

Таким образом, если инвестор обнаружит, что p-значение равно 0,001, есть убедительные доказательства против нулевой гипотезы, и инвестор может с уверенностью заключить, что доходность портфеля и доходность S&P 500 не эквивалентны.

Хотя это не дает точного порога того, когда инвестор должен принять или отклонить нулевую гипотезу, у него есть еще одно очень практическое преимущество. Проверка гипотезы P-значения предлагает прямой способ сравнить относительную уверенность, которую может иметь инвестор при выборе между несколькими различными типами инвестиций или портфелей по сравнению с эталоном, таким как S&P 500.

Например, для двух портфелей, A и B, эффективность которых отличается от S&P 500 с p-значениями 0,10 и 0,01 соответственно, инвестор может быть гораздо более уверен, что портфель B с более низким p-значением действительно покажет постоянно разные результаты.

Значимо ли значение Р 0,05?

Значение p менее 0,05 обычно считается статистически значимым, и в этом случае нулевую гипотезу следует отклонить. Значение p больше 0,05 означает, что отклонение от нулевой гипотезы не является статистически значимым, и нулевая гипотеза не отвергается.

Что означает P-значение 0,001?

Значение p, равное 0,001, указывает на то, что если бы проверенная нулевая гипотеза действительно была верной, то был бы один шанс из 1000 увидеть результаты, по крайней мере, столь же экстремальные. Это приводит к тому, что наблюдатель отклоняет нулевую гипотезу, потому что либо наблюдался очень редкий результат данных, либо нулевая гипотеза неверна.

Как можно использовать P-значение для сравнения двух разных результатов проверки гипотез?

Если у вас есть два разных результата, один с p-значением 0,04 и один с p-значением 0,06, результат с p-значением 0,04 будет считаться более статистически значимым, чем p-значение 0,06. Помимо этого упрощенного примера, вы можете сравнить p-значение 0,04 с p-значением 0,001. Оба статистически значимы, но пример 0,001 дает еще более сильный аргумент против нулевой гипотезы, чем пример 0,04.

Итог

Значение p используется для измерения значимости данных наблюдений. Когда исследователи выявляют очевидную взаимосвязь между двумя переменными, всегда существует вероятность того, что эта корреляция может быть совпадением. Расчет p-значения помогает определить, может ли наблюдаемая взаимосвязь возникнуть случайно.

Исправление от 2 апреля 2022 г.: В предыдущей версии p-значение неверно описывалось как вероятность результатов, возникающих в результате случайного совпадения.

Что это такое и как оно используется в инвестировании?

Что такое нулевая гипотеза?

Нулевая гипотеза — это тип статистической гипотезы, которая предполагает отсутствие статистической значимости в наборе данных наблюдений. Проверка гипотезы используется для оценки достоверности гипотезы с использованием выборочных данных. Иногда его называют просто «нулем», он представлен как H 0 .

Нулевая гипотеза, также известная как гипотеза, используется в количественном анализе для проверки теорий о рынках, инвестиционных стратегиях или экономике, чтобы решить, является ли идея верной или ложной.

Ключевые выводы

  • Нулевая гипотеза — это разновидность гипотезы в статистике, которая предполагает отсутствие различий между определенными характеристиками населения или процесса, генерирующего данные.
  • Альтернативная гипотеза предполагает наличие разницы.
  • Проверка гипотез обеспечивает метод отклонения нулевой гипотезы в пределах определенного уровня достоверности.
  • Если вы можете отвергнуть нулевую гипотезу, это обеспечивает поддержку альтернативной гипотезы.
  • Проверка нулевой гипотезы лежит в основе принципа фальсификации в науке.
Нулевая гипотеза

Как работает нулевая гипотеза

Нулевая гипотеза — это тип гипотезы в статистике, которая предполагает, что нет никакой разницы между определенными характеристиками населения или процесса, генерирующего данные. Например, игрока может интересовать, честна ли азартная игра. Если честно, то ожидаемая прибыль за игру равна нулю для обоих игроков. Если игра нечестная, то ожидаемая прибыль положительна для одного игрока и отрицательна для другого. Чтобы проверить, является ли игра честной, игрок собирает данные о доходах от многих повторений игры, вычисляет средний доход на основе этих данных, а затем проверяет нулевую гипотезу о том, что ожидаемый доход не отличается от нуля.

Если средние доходы по данным выборки достаточно далеки от нуля, то игрок отклонит нулевую гипотезу и сделает вывод об альтернативной гипотезе, а именно о том, что ожидаемые доходы за игру отличны от нуля. Если средний заработок по данным выборки близок к нулю, то игрок не отвергнет нулевую гипотезу, а вместо этого сделает вывод, что разница между средним значением по данным и нулем может быть объяснена только случайностью.

Нулевая гипотеза предполагает, что любое различие между выбранными характеристиками, которое вы видите в наборе данных, обусловлено случайностью. Например, если ожидаемый заработок в азартной игре действительно равен нулю, то любая разница между средним заработком в данных и нулем обусловлена ​​случайностью.

Аналитики стремятся отклонить   нулевую гипотезу, потому что это является сильным выводом. Это требует веских доказательств в виде наблюдаемой разницы, которая слишком велика, чтобы ее можно было объяснить исключительно случайностью. Неспособность отвергнуть нулевую гипотезу — о том, что результаты можно объяснить только случайностью — является слабым выводом, потому что он допускает, что другие факторы, помимо случайности, могут действовать, но могут быть недостаточно сильными, чтобы статистический тест мог их обнаружить.

Нулевая гипотеза может быть только отвергнута, но не доказана.

Альтернативная гипотеза

Важно отметить, что мы проверяем нулевую гипотезу, потому что есть элемент сомнения в ее достоверности. Любая информация, противоречащая заявленной нулевой гипотезе, фиксируется в альтернативной (альтернативной) гипотезе (h2).

Для приведенных выше примеров альтернативной гипотезой будет:

  • Средний балл учащихся составляет , а не равно семи.
  • Среднегодовая доходность взаимного фонда составляет , а не , что равно 8% в год.

Другими словами, альтернативная гипотеза прямо противоречит нулевой гипотезе.

Примеры нулевой гипотезы

Вот простой пример: директор школы утверждает, что учащиеся ее школы набирают в среднем семь баллов из 10 на экзаменах. Нулевая гипотеза состоит в том, что среднее значение генеральной совокупности равно 7,0. Чтобы проверить эту нулевую гипотезу, мы записываем оценки, скажем, 30 учеников (выборка) из всего студенческого контингента школы (скажем, 300) и вычисляем среднее значение этой выборки.

Затем мы можем сравнить (расчетное) среднее значение выборки с (гипотетическим) средним значением генеральной совокупности, равным 7,0, и попытаться отвергнуть нулевую гипотезу. (Здесь нулевая гипотеза о том, что среднее значение генеральной совокупности равно 7,0, не может быть доказана с использованием выборочных данных. Ее можно только отвергнуть.)

Возьмем другой пример: заявлено, что годовой доход конкретного паевого фонда составляет 8%. Предположим, что взаимный фонд существует уже 20 лет. Нулевая гипотеза состоит в том, что средняя доходность взаимного фонда составляет 8%. Мы берем случайную выборку годовых доходов взаимного фонда, скажем, за пять лет (выборка) и вычисляем выборочное среднее. Затем мы сравниваем (расчетное) среднее значение выборки с (заявленным) средним значением генеральной совокупности (8%), чтобы проверить нулевую гипотезу.

Для приведенных выше примеров нулевые гипотезы:

  • Пример A : Учащиеся школы получают в среднем семь баллов из 10 на экзаменах.
  • Пример B: Среднегодовая доходность взаимного фонда составляет 8% в год.

В целях определения того, следует ли отклонить нулевую гипотезу, предполагается, что нулевая гипотеза (сокращенно H 0 ) верна в качестве аргумента. Затем в соответствии с этим предположением определяется вероятный диапазон возможных значений рассчитанной статистики (например, средний балл по тестам 30 учащихся) (например, диапазон правдоподобных средних значений может варьироваться от 6,2 до 7,8, если среднее значение генеральной совокупности равно 7,0). Затем, если среднее значение выборки выходит за пределы этого диапазона, нулевая гипотеза отклоняется. В противном случае говорят, что разница «объясняется только случайностью», находясь в пределах диапазона, определяемого только случайностью.

Как проверка нулевой гипотезы используется в инвестициях

В качестве примера, связанного с финансовыми рынками, предположим, что Алиса видит, что ее инвестиционная стратегия обеспечивает более высокую среднюю доходность, чем просто покупка и владение акциями. Нулевая гипотеза утверждает, что между двумя средними доходами нет разницы, и Алиса склонна верить в это до тех пор, пока не сможет прийти к противоречивым результатам.

Опровержение нулевой гипотезы потребует демонстрации статистической значимости, которую можно найти с помощью различных тестов. Альтернативная гипотеза утверждает, что инвестиционная стратегия имеет более высокую среднюю доходность, чем традиционная стратегия «купи и держи».

Одним из инструментов, который может определить статистическую значимость результатов, является p-значение. Значение p представляет собой вероятность того, что разница, столь же большая или превышающая наблюдаемую разницу между двумя средними доходностями, может возникнуть исключительно случайно.

Значение p, меньшее или равное 0,05, часто указывает на наличие доказательств против нулевой гипотезы. Если Алиса проведет один из этих тестов, например, тест с использованием нормальной модели, в результате чего будет выявлена ​​значительная разница между ее доходами и доходами по схеме «купи и держи» (значение p меньше или равно 0,05), она может затем отвергнуть нулевую гипотезу и сделать вывод об альтернативной гипотезе.

Как определить нулевую гипотезу?

Аналитик или исследователь выдвигает нулевую гипотезу на основе исследовательского вопроса или проблемы, на которую они пытаются ответить. В зависимости от вопроса нуль может быть идентифицирован по-разному. Например, если вопрос состоит просто в том, существует ли эффект (например, влияет ли X на Y?), нулевая гипотеза может быть H 0 : X = 0. Если вместо этого возникает вопрос, совпадает ли X с Y, H0 будет X = Y. Если влияние X на Y положительное, H0 будет X > 0. Если результирующий анализ показывает влияние, которое статистически значимо отличается от нуля, нуль можно отклонить.

Как нулевая гипотеза используется в финансах?

В финансах при количественном анализе используется нулевая гипотеза. Нулевая гипотеза проверяет предпосылки инвестиционной стратегии, рынков или экономики, чтобы определить, верна она или нет. Например, аналитик может захотеть увидеть, тесно ли связаны две акции, ABC и XYZ. Нулевая гипотеза будет ABC ≠ XYZ.

Как проверяются статистические гипотезы?

Статистические гипотезы проверяются в четыре этапа. Первый шаг для аналитика состоит в том, чтобы сформулировать две гипотезы так, чтобы только одна из них была верной. Следующим шагом является разработка плана анализа, в котором описывается, как будут оцениваться данные. Третий шаг — выполнить план и физически проанализировать выборочные данные. Четвертый и последний шаг — проанализировать результаты и либо отвергнуть нулевую гипотезу, либо заявить, что наблюдаемые различия можно объяснить только случайностью.

Что такое альтернативная гипотеза?

Альтернативная гипотеза прямо противоречит нулевой гипотезе. Это означает, что если одна из двух гипотез верна, то другая ложна.

Типы и использование в инвестировании

Что такое вероятностное распределение?

Распределение вероятностей — это статистическая функция, описывающая все возможные значения и вероятности, которые случайная величина может принимать в заданном диапазоне. Этот диапазон будет ограничен минимальным и максимальным возможными значениями, но именно то, где возможное значение, вероятно, будет нанесено на график распределения вероятностей, зависит от ряда факторов. Эти факторы включают среднее значение распределения (среднее), стандартное отклонение, асимметрию и эксцесс.

Как работает распределение вероятностей

Возможно, наиболее распространенным распределением вероятностей является нормальное распределение, или «колоколообразная кривая», хотя существует несколько широко используемых распределений. Как правило, процесс генерации данных о каком-либо явлении определяет его вероятностное распределение. Этот процесс называется функцией плотности вероятности.

Распределения вероятностей также можно использовать для создания кумулятивных функций распределения (CDF), которые суммируют вероятность событий кумулятивно и всегда начинаются с нуля и заканчиваются на 100%.

Ученые, финансовые аналитики и управляющие фондами могут определить распределение вероятности конкретной акции, чтобы оценить возможную ожидаемую доходность, которую акция может принести в будущем. История доходности акции, которую можно измерить за любой временной интервал, вероятно, будет состоять только из части доходности акции, что приведет к ошибке выборки при анализе. Увеличивая размер выборки, эту ошибку можно значительно уменьшить.

Основные выводы

  • Распределение вероятностей отображает ожидаемые результаты возможных значений для заданного процесса генерации данных.
  • Распределения вероятностей бывают разных форм с различными характеристиками, определяемыми средним значением, стандартным отклонением, асимметрией и эксцессом.
  • Инвесторы используют распределения вероятностей для прогнозирования доходности активов, таких как акции, с течением времени и для хеджирования своих рисков.

Типы вероятностных распределений

Существует множество различных классификаций вероятностных распределений. Некоторые из них включают нормальное распределение, распределение хи-квадрат, биномиальное распределение и распределение Пуассона. Различные распределения вероятностей служат разным целям и представляют разные процессы генерации данных. Биномиальное распределение, например, оценивает вероятность того, что событие произойдет несколько раз в течение заданного числа испытаний и с учетом вероятности события в каждом испытании. и может быть получен путем отслеживания того, сколько штрафных бросков делает баскетболист в игре, где 1 = попадание в корзину, а 0 = промах. Другим типичным примером может быть использование честной монеты и определение вероятности того, что эта монета выпадет орлом за 10 бросков подряд. Биномиальное распределение равно дискретный , в отличие от непрерывного, поскольку только 1 или 0 являются допустимым ответом.

Наиболее часто используемым распределением является нормальное распределение, которое часто используется в финансах, инвестициях, науке и технике. Нормальное распределение полностью характеризуется своим средним значением и стандартным отклонением, что означает, что распределение не является асимметричным и имеет эксцесс. Это делает распределение симметричным, и на графике оно изображается в виде колоколообразной кривой. Нормальное распределение определяется средним (средним) значением, равным нулю, и стандартным отклонением, равным 1,0, с асимметрией, равной нулю, и эксцессом, равным 3. При нормальном распределении примерно 68% собранных данных будут находиться в пределах +/- одного стандарта. отклонение среднего; примерно 95% в пределах +/- двух стандартных отклонений; и 99,7% в пределах трех стандартных отклонений. В отличие от биномиального распределения, нормальное распределение является непрерывным, что означает, что представлены все возможные значения (в отличие от только 0 и 1 без промежуточных значений).

Распределения вероятностей, используемые в инвестировании

Часто предполагается, что доходность акций имеет нормальное распределение, но в действительности они демонстрируют эксцесс с большими отрицательными и положительными доходами, которые, кажется, возникают больше, чем можно было бы предсказать при нормальном распределении. Фактически, поскольку цены акций ограничены нулем, но предлагают потенциально неограниченный потенциал роста, распределение доходности акций было описано как логарифмически нормальное. Это видно на графике доходности акций, где хвосты распределения имеют большую толщину.

Распределения вероятностей часто используются в управлении рисками, а также для оценки вероятности и суммы убытков, которые может понести инвестиционный портфель, на основе распределения исторической доходности. Одним из популярных показателей управления рисками, используемых в инвестировании, является стоимость под риском (VaR). VaR дает минимальные убытки, которые могут возникнуть с учетом вероятности и временных рамок портфеля.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *