Вероятностные подходы к идентификации евреев

Модератор: MOCKBA

Сообщение
Автор
Любовь Гиль
Сообщения: 2597
Возраст: 71
Регистрация: 23.11.2011
Откуда: Беэр-Шева, Израиль
Благодарил (а): 1693 раза
Поблагодарили: 771 раз

Re: Вероятностные подходы к идентификации евреев

#21 Сообщение Любовь Гиль » 05 июл 2012, 20:54

oztech писал(а):
michael_frm_jrslm писал(а):
oztech писал(а):Предлагаю решение в лоб: должны произойти 3 одновременных событиях, вероятность каждого из которых - 0,1. Вероятности одновременных событий умножаются, т.е. произведение равно 0,001 или 0,1%.

Ну сами посудите. При таком подходе вероятность противоположного события ("Леонид Борисович Сапожников - НЕ еврей") должна была бы считаться как 0.9*0.9*0.9=0.729. А ведь в сумме эти две вероятности должны давать единицу.

Ну, что ж, давайте совершим небольшой экскурс в теорию вероятности, благо, еще и полувека не прошло, как нам ее читали на 2 курсе, и тема способствует. Кроме событий, рассмотренных мной и Вами, есть и другие вероятные исходы.
Когда одновременно совпадает одно событие, а два других - нет, то вероятность таких исходов 3*0,1*0,9*0,9=0,243.
Когда одновременно совпадают два события, а третье - нет, то вероятность таких исходов 3*0,1*0,1*0,9=0,027.
Теперь сложим 0,001+0,243+0,027+0,729, и будет нам с Вами счастье в виде полноценной единицы общей вероятности.
Попутно, еще и на Юлину реплику ответ: вероятность одновременного совпадения всех трех событий сразу - 0,001,
вероятность совпадения хотя бы одного события из трех - 0,001+0,243+0,027=1-0,729=0,271.

Но на самом деле я по-прежнему не вижу никакой практической пользы в этих оценках. Может, конечно, когда Михаил раскроет свой секрет, мое мнение изменится.
michael_frm_jrslm писал(а):А причем тут "чистота кровей"?

А что касается "чистоты крови", то, конечно, это словосочетание изначально должно было быть в кавычках, я его использовал только для обозначения вероятных исходов гипотетического эксперимента.



А как Вы думаете для чего в условии задачи сказано, что в Москве проживает 1 процент евреев? Разве в решении это не следует использовать? Подумайте ещё.
Интересуют:
Абрамские - Мосты Гродненской губ., Таврическая губ., в т.ч. Каховка, Херсон, Одесса
Шар(о)городские - Перекоп, Армянский базар (Армянск),Таврическая,Херсонская, Киевская губ., Подолье
Зайцовы/Зайцевы - Херсон, Херсонская и Таврическая губ., Каховка, Берислав, Могилев и др.
Уманские - Таврическая и Херсонская губ., Херсон, Алешки и др.
Боград - Сенно Могилевской губ., Херсон, Херсонская губ., в т.ч. еврейские колонии - Новоковно, Добрая и др.
Блох - Россиены Ковенской губ., Херсон, Николаев
Фельдман - Херсон, Николаев
Куперман - Николаев
Гиль - Янушполь (ранее Иванополь) Житомирск.
Бенционовы, Фишман - Екатеринослав

oztech
Сообщения: 4117
Возраст: 69
Регистрация: 01.09.2009
Откуда: Санкт-Петербург
Благодарил (а): 173 раза
Поблагодарили: 1127 раз

Re: Вероятностные подходы к идентификации евреев

#22 Сообщение oztech » 05 июл 2012, 22:15

Не, больше не буду, а то пожилая "думалка" сломается. Я помню про 1%, но считаю его лишним условием.
Григорий

Аватара пользователя
Юлия_П
Администратор
Сообщения: 11687
Регистрация: 17.07.2009
Откуда: Одесса-Украина
Благодарил (а): 1079 раз
Поблагодарили: 1572 раза

Re: Вероятностные подходы к идентификации евреев

#23 Сообщение Юлия_П » 05 июл 2012, 22:20

oztech писал(а):Не, больше не буду, а то пожилая "думалка" сломается. Я помню про 1%, но считаю его лишним условием.
А почему лишним? Разве вероятность будет одинаковой и в городе, где евреев 1%, и в городе, где евреев нет, и где евреи большинство?
Захарин - Полоцк (Витебская губерния), Ковно, Харьков
Кацев - Ушачи, Лепель, Полоцк (Витебская губерния), Харьков

База данных Архивные ссылки searchdb_form.php

Аватара пользователя
Jorge
Сообщения: 6205
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 186 раз

Re: Вероятностные подходы к идентификации евреев

#24 Сообщение Jorge » 05 июл 2012, 23:32

Я пока решил, что не буду приводить здесь строгий вывод формулы. Могущие и желающие увидеть строгий вывод либо произведут его сами, либо я могу поделиться им в частном порядке с тем, кто захочет. Остальным не буду морочить голову промежуточными формулами.

Однако, перед тем, как вывести формулу, я пришел к ней путем размышлений, используя умозрительные ассоциации. Удивительным образом, результаты совпали. Поэтому я расскажу о том, как прийти к результату при помощи моей интерпретации.

Вспомним, что такое вероятность. Это математическая абстракция, число, являющееся пределом отношения результатов множества одинаковых независимых экспериментов при неограниченном росте числа экспериментов. Важная особенность вероятности в том, что она существует внутри отрезка [0, 1]. Вместо вероятности одного из двух взаимоисключающих событий р и (1-р) рассмотрим новую величину
q = p/(1-p),
которую мы назовем относительной вероятностью одного из двух взаимоисключающих событий. Например, если в местечке 75% - евреи, то относительная вероятность того, что случайно встреченный прохожий - еврей, равна 3. Легко видеть, что новая величина q лежит между нулем и бесконечностью.

Теперь вспомним о соотношении априорной (до опыта) и апостериорной (после опыта) вероятностей. Например, априорная вероятность того, что случайно встреченный нами москвич - еврей, равна, согласно условию задачи, 1%. Апостериорная вероятность того же события, когда мы узнали, что он Сапожников, оказалась уже много выше - 10%. Зависимость априорной и апостериорной вероятностей описывается теоремой Байеса. Для наших же целей я хочу ввести новую величину - относительную частоту события, основанную на апостериорном знании. Она равна отношению апостериорной и априорной относительных вероятностей события. В случае москвича Сапожникова из нашей задачи, относительная частота евреев Сапожниковых в Москве равна (1/9)/(1/99) = 11. Аналогично, относительные частоты Леонидов и Борисовичей - также 11. Важно заметить, что относительная частота не должна сильно меняться по времени и месту. Скажем, из Москвы уедет еще половина евреев. При этом априорная и апостериорная относительные вероятности, о которых мы говорили выше, должны одновременно упасть вдвое, а относительная частота останется прежней. Стало быть, относительная частота - это достаточно фундаментальная характеристика, зависящая только от исходной гипотезы (N - еврей) и результата опыта (N - Сапожников). И тут в принципе неважно, рассматриваем ли мы Сапожниковых среди москвичей, бруклинцев, Иванов, Марков, москвичей Леонидов, и т.д. Итак, можно достаточно уверенно сказать, что

Относительная вероятность того, что N - еврей, возрастает в 11 раз, если оказывается, что он - Сапожников.

Аналогично:

Относительная вероятность того, что N - еврей, возрастает в 11 раз, если оказывается, что он - Леонид.
Относительная вероятность того, что N - еврей, возрастает в 11 раз, если оказывается, что он - Борисович.


В результате, мы можем также утверждать, что

Относительная вероятность того, что N - еврей, возрастает в 1331 раз, если оказывается, что он - Леонид Борисович Сапожников.

Вероятность того, что москвич - еврей, мы приняли за 1/99. Таким образом, относительная вероятность того, что москвич Леонид Борисович Сапожников - еврей, равна 1331/99. В терминах обычных вероятностей, это 93%. Уверен, этот результат многим покажется неожиданным, но он в точности совпадает с результатом, полученным путем строгого использования теоремы Байеса.

Должен оговориться, что все исходные цифры я брал с потолка. О том, где взять более правильные цифры, поговорим позже.

Аватара пользователя
Nison
Сообщения: 6389
Возраст: 40
Регистрация: 17.07.2009
Откуда: Кострома
Благодарил (а): 219 раз
Поблагодарили: 925 раз
Контактная информация:

Re: Вероятностные подходы к идентификации евреев

#25 Сообщение Nison » 05 июл 2012, 23:59

ну если уж так - вам известны галахические понятия коль депариш мируба париш и коль акавуа кемехеца аль мехеца? Каждый, кто отделился - отделился от большинства. А все постоянные как половина на половину
Руппо, Дрейзеншток, Гаухман (Камень, Лепельского района). Пуховицкий, Ефес, Рендар (Староселье, Шкловского района). Эйдельштейн (Мозырь). Эпштейн (Рига). Папков (Витебская область)

Аватара пользователя
Юлия_П
Администратор
Сообщения: 11687
Регистрация: 17.07.2009
Откуда: Одесса-Украина
Благодарил (а): 1079 раз
Поблагодарили: 1572 раза

Re: Вероятностные подходы к идентификации евреев

#26 Сообщение Юлия_П » 06 июл 2012, 01:13

Nison писал(а):ну если уж так - вам известны галахические понятия коль депариш мируба париш и коль акавуа кемехеца аль мехеца? Каждый, кто отделился - отделился от большинства. А все постоянные как половина на половину

Нисон, Вы не могли бы объяснить мне (тёмной :( ), что имеется в виду?
Захарин - Полоцк (Витебская губерния), Ковно, Харьков
Кацев - Ушачи, Лепель, Полоцк (Витебская губерния), Харьков

База данных Архивные ссылки searchdb_form.php

Аватара пользователя
Jorge
Сообщения: 6205
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 186 раз

Re: Вероятностные подходы к идентификации евреев

#27 Сообщение Jorge » 06 июл 2012, 11:35

Нисон вспомнил о том, что ещё много веков назад евреи задумывались о вероятностных подходах к определению еврейства. Но на мой взгляд, к настоящей дискуссии это отношения не имеет. Нас здесь интересует не галахическое определение еврейства, а наличие еврейских корней.

Любовь Гиль
Сообщения: 2597
Возраст: 71
Регистрация: 23.11.2011
Откуда: Беэр-Шева, Израиль
Благодарил (а): 1693 раза
Поблагодарили: 771 раз

Re: Вероятностные подходы к идентификации евреев

#28 Сообщение Любовь Гиль » 06 июл 2012, 12:00

JorgeDelCaminoReal писал(а):Я пока решил, что не буду приводить здесь строгий вывод формулы. Могущие и желающие увидеть строгий вывод либо произведут его сами, либо я могу поделиться им в частном порядке с тем, кто захочет. Остальным не буду морочить голову промежуточными формулами.

Однако, перед тем, как вывести формулу, я пришел к ней путем размышлений, используя умозрительные ассоциации. Удивительным образом, результаты совпали. Поэтому я расскажу о том, как прийти к результату при помощи моей интерпретации.

Вспомним, что такое вероятность. Это математическая абстракция, число, являющееся пределом отношения результатов множества одинаковых независимых экспериментов при неограниченном росте числа экспериментов. Важная особенность вероятности в том, что она существует внутри отрезка [0, 1]. Вместо вероятности одного из двух взаимоисключающих событий р и (1-р) рассмотрим новую величину
q = p/(1-p),
которую мы назовем относительной вероятностью одного из двух взаимоисключающих событий. Например, если в местечке 75% - евреи, то относительная вероятность того, что случайно встреченный прохожий - еврей, равна 3. Легко видеть, что новая величина q лежит между нулем и бесконечностью.

Теперь вспомним о соотношении априорной (до опыта) и апостериорной (после опыта) вероятностей. Например, априорная вероятность того, что случайно встреченный нами москвич - еврей, равна, согласно условию задачи, 1%. Апостериорная вероятность того же события, когда мы узнали, что он Сапожников, оказалась уже много выше - 10%. Зависимость априорной и апостериорной вероятностей описывается теоремой Байеса. Для наших же целей я хочу ввести новую величину - относительную частоту события, основанную на апостериорном знании. Она равна отношению апостериорной и априорной относительных вероятностей события. В случае москвича Сапожникова из нашей задачи, относительная частота евреев Сапожниковых в Москве равна (1/9)/(1/99) = 11. Аналогично, относительные частоты Леонидов и Борисовичей - также 11. Важно заметить, что относительная частота не должна сильно меняться по времени и месту. Скажем, из Москвы уедет еще половина евреев. При этом априорная и апостериорная относительные вероятности, о которых мы говорили выше, должны одновременно упасть вдвое, а относительная частота останется прежней. Стало быть, относительная частота - это достаточно фундаментальная характеристика, зависящая только от исходной гипотезы (N - еврей) и результата опыта (N - Сапожников). И тут в принципе неважно, рассматриваем ли мы Сапожниковых среди москвичей, бруклинцев, Иванов, Марков, москвичей Леонидов, и т.д. Итак, можно достаточно уверенно сказать, что

Относительная вероятность того, что N - еврей, возрастает в 11 раз, если оказывается, что он - Сапожников.

Аналогично:

Относительная вероятность того, что N - еврей, возрастает в 11 раз, если оказывается, что он - Леонид.
Относительная вероятность того, что N - еврей, возрастает в 11 раз, если оказывается, что он - Борисович.


В результате, мы можем также утверждать, что

Относительная вероятность того, что N - еврей, возрастает в 1331 раз, если оказывается, что он - Леонид Борисович Сапожников.

Вероятность того, что москвич - еврей, мы приняли за 1/99. Таким образом, относительная вероятность того, что москвич Леонид Борисович Сапожников - еврей, равна 1331/99. В терминах обычных вероятностей, это 93%. Уверен, этот результат многим покажется неожиданным, но он в точности совпадает с результатом, полученным путем строгого использования теоремы Байеса.

Должен оговориться, что все исходные цифры я брал с потолка. О том, где взять более правильные цифры, поговорим позже.



Jorge!
Я действовала как раз по формуле Байеса, но наши результаты резко
отличаются. Пришлите, пожалуйста, Ваши описания событий и присвоенные им значения
согласно Вашего условия ( имею в виду решение по Баейсу), можно мне в личку.
Ваш вопрос аналогичен следующему:
Какова вероятность того, что случайно встреченный человек с Ф.И.О. - Сапожников
Леонид Борисович оказался евреем?
Из вашего условия можно сделать вывод, что среди живущих в Москве Сапожниковых
90 процентов русских, то же - для Леонидов и то же для Борисовичей.
Или это не так? А если да, то тогда Ваш ответ кажетя действительно неожиданным, если не более.
Всего Вам доброго, жду Вашего ответа.
Интересуют:
Абрамские - Мосты Гродненской губ., Таврическая губ., в т.ч. Каховка, Херсон, Одесса
Шар(о)городские - Перекоп, Армянский базар (Армянск),Таврическая,Херсонская, Киевская губ., Подолье
Зайцовы/Зайцевы - Херсон, Херсонская и Таврическая губ., Каховка, Берислав, Могилев и др.
Уманские - Таврическая и Херсонская губ., Херсон, Алешки и др.
Боград - Сенно Могилевской губ., Херсон, Херсонская губ., в т.ч. еврейские колонии - Новоковно, Добрая и др.
Блох - Россиены Ковенской губ., Херсон, Николаев
Фельдман - Херсон, Николаев
Куперман - Николаев
Гиль - Янушполь (ранее Иванополь) Житомирск.
Бенционовы, Фишман - Екатеринослав

Аватара пользователя
Jorge
Сообщения: 6205
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 186 раз

Re: Вероятностные подходы к идентификации евреев

#29 Сообщение Jorge » 06 июл 2012, 12:59

Любовь Гиль писал(а): Jorge!
Я действовала как раз по формуле Байеса, но наши результаты резко
отличаются. Пришлите, пожалуйста, Ваши описания событий и присвоенные им значения
согласно Вашего условия ( имею в виду решение по Баейсу), можно мне в личку.
Ваш вопрос аналогичен следующему:
Какова вероятность того, что случайно встреченный человек с Ф.И.О. - Сапожников
Леонид Борисович оказался евреем?
Из вашего условия можно сделать вывод, что среди живущих в Москве Сапожниковых
90 процентов русских, то же - для Леонидов и то же для Борисовичей.
Или это не так? А если да, то тогда Ваш ответ кажетя действительно неожиданным, если не более.
Всего Вам доброго, жду Вашего ответа.
Да, результат парадоксальный, и вот его более строгий вывод:

Допустим, имеется гипотеза Н (скажем, что N является евреем). Она дополняется и взаимоисключается гипотезой !Н (соответственно, что N - нееврей). Пока что не рассматриваем наличие более, чем 2 гипотез. Далее, постулируем, что в пределах каждой из гипотез все критерии, о которых ниже, распределены равномерно. Так, если мы возьмём 2 критерия С1 = "Фамилия: Сапожников" и С2 = "Имя: Леонид", то P(C1, C2 | H) = P(C1 | H) * P(C2 | H).

Нам известна априорная вероятность гипотезы Н : P(H) = h. Также нам известны распределения критериев по гипотезам: P(H | C1) = c1, P(H | C2) = c2, P(H | C3) = c3. Итак:

c1 = P(H | C1) = (теорема Бэйза) P(C1 | H) * P(H) / P(C1) = (теорема о полной вероятности) P(C1 | H) * h / (P(C1 | H) * h + P(C1 | !H) * (1-h)) = 1 / (1 + P(C1 | !H) * (1-h) / P(C1 | H) / h) =>

1/c1 - 1 = P(C1 | !H) * (1-h) / P(C1 | H) / h. (1)

Аналогично,

1/c2 - 1 = P(C2 | !H) * (1-h) / P(C2 | H) / h. (2)
1/c3 - 1 = P(C3 | !H) * (1-h) / P(C3 | H) / h. (3)

Теперь получаем:

P(H | C1, C2, C3) = P(C1, C2, C3 | H) * P(H) / P(C1, C2, C3) = P(C1 | H) * P (C2 | H) * P (C3 | H) * h / (P(C1 | H) * P (C2 | H) * P (C3 | H) * h + P(C1 | !H) * P (C2 | !H) * P (C3 | !H) * (1-h)) =
= 1/(1 + P(C1 | !H) * P (C2 | !H) * P (C3 | !H) * (1-h) / P(C1 | H) / P (C2 | H) / P (C3 | H) / h) = (подставляем (1), (2) и (3))
= 1/(1 + (1/c1 - 1) * (1/c2 - 1) * (1/c3 - 1) * h * h / (1-h) / (1-h)). Итак:

P(H | C1, C2, C3) = 1/(1 + (1/c1 - 1) * (1/c2 - 1) * (1/c3 - 1) * h * h / (1-h) / (1-h)). (3)

Можно подставить наши цифры в эту формулу. 1/(с1 - 1) = (1/c2 - 1) = (1/c3 - 1) = 9; h / (1-h) = 1/99. Имеем: 1/(1 + 9 * 9 * 9 /99 / 99) = 1/(1 + 9/121) = 121/130 = 93%.

Аватара пользователя
Jorge
Сообщения: 6205
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 186 раз

Re: Вероятностные подходы к идентификации евреев

#30 Сообщение Jorge » 06 июл 2012, 13:23

oztech писал(а):Ну, что ж, давайте совершим небольшой экскурс в теорию вероятности, благо, еще и полувека не прошло, как нам ее читали на 2 курсе, и тема способствует.
Григорий, ваши вычисления не имеют связи с рассматриваемой задачей. Если бы в Москве было 10% Сапожниковых, 10% Леонидов и 10% Борисовичей, то можно было бы, предположив, что эти 3 события независимы, говорить, что в Москве каждый тысячный - Сапожников Леонид Борисович. У нас же тут совершенно другая задача.
Друзья! Наряду с форумом, не забывайте заглядывать на сайт: http://j-roots.info/
Наша эксклюзивная База Данных http://j-roots.info/index.php?option=co ... Itemid=294 постоянно пополняется. Следите за обновлениями.

Ищу:
Поляк (Вильна, Варшава, С.-Петербург, Калуга, Баку, Харьков, Париж/Ле Лила, Дранси-Аушвиц, Аргентина, и Полк (Нью-Йорк, Лос Анжелес); Духовны (Вильна); Фридберг (Богуславишки, Вильна, Варшава, Порозово); Грилихес (Вильна); Рубинштейн (Тельши, Вильна); Райз (Варшава, Чернигов, С.-Петербург, Москва).
Гинзбург (Шклов, Могилёв, Невель, Луга, Нарва, С.-Петербург, Елгава, Варшава, Париж, Ницца); Кисельгоф (Москва); Фридзон (С.-Петербург);
Трейвас (Полоцк, С.-Петербург, Москва, Рига); Галёркин (Полоцк, С.-Петербург, Москва и везде); Гитлин (Полоцк)


На вопросы по книге Бейдера отвечаю только на форуме.

Аватара пользователя
Nison
Сообщения: 6389
Возраст: 40
Регистрация: 17.07.2009
Откуда: Кострома
Благодарил (а): 219 раз
Поблагодарили: 925 раз
Контактная информация:

Re: Вероятностные подходы к идентификации евреев

#31 Сообщение Nison » 06 июл 2012, 17:19

Задумывались о вероятностных подходах да. Но не по определению еврейства. Речь о еврействе по галахе тут совсем не идет, ведь фамилия обычно по папе передается.

Пример: в городе есть 10 мясных магазинов. 9 кошерных и 1 трефной. Если на улице нашли кусок мяса и не известно из какого он магазина, то по букве закона это мясо можно съесть, поскольку большинство магазинов кошерны (я лично никогда бы не съел такой кусок, вдруг он из некошерного магазина).
Но если человек купил мясо в магазине, и не помнит в каком - кошерном или трефном, то это мясо есть нельзя.
Разница такая - когда мясо нашли на улице, аз пределами магазинов, оно считается "отделенным", а все что отделяется, отделяется от большинства. А когда мясо куплено в магазине, оно считается "постоянным", то есть шансы, что оно куплено в некошерном магазине 50 на 50. Здесь уже не важно сколько именно в городе магазинов кошерных, а сколько трефных. Есть 2 опции - "или мы встретим на улице динозавра или нет".
Руппо, Дрейзеншток, Гаухман (Камень, Лепельского района). Пуховицкий, Ефес, Рендар (Староселье, Шкловского района). Эйдельштейн (Мозырь). Эпштейн (Рига). Папков (Витебская область)

Аватара пользователя
Jorge
Сообщения: 6205
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 186 раз

Re: Вероятностные подходы к идентификации евреев

#32 Сообщение Jorge » 07 июл 2012, 11:19

Первый шок от парадоксального результата, видимо, схлынул, и можно поговорить о том, откуда брать исходные данные для оценки. В данный момент я фактически составляю инструкцию для обработки смешанных списков для нашей базы данных.

1. Оценка общего процента евреев в данном месте в данное время.
Неоценимый источник - Демоскоп. Его приложения http://demoscope.ru/weekly/pril.php содержат результаты переписей 1897, 1926, 1939 и последующих годов.

2. Оценка процента евреев среди людей с данной фамилией.
А) Универсальный источник - страница Морзе. Если у Вас есть подозрения, что фамилия совсем нееврейская, то можно начать отсюда. Если у Морзе нет, то почти наверняка она принадлежит нееврею. Но могут быть исключения.
а) Имя не оставляет сомнений в том, что перед нами еврей. Например, Менахем Борухович. Это означает, что мы столкнулись с редким случаем, когда Бейдеру незнакома эта могущая буть еврейской фамилия. И человек этот - еврей. Можно сообщить Бейдеру о находке: он, вероятно, вставит новую фамилию в следующее издание словаря. Однако, например, Яков Моисеевич - это ещё не гарантия, что человек - еврей.
б) Фамилия написана с опечаткой. Если невозможно разгадать, какая фамилия имелась в виду, и в ней нет характерных национальных элементов (-барг, бойм), то стоит просто выбросить фамилию из рассмотрения.
Б) ОБД Мемориал. Если фамилия достаточно частая, то это - прекрасный источник статистической информации. Но следует иметь в виду:
а) Многие лица повторяются по многу раз, как еврейские, так и нееврейские. По хорошему, стоит считать каждого по разу.
б) Не всегда удаётся ответить на вопрос еврей-нееврей. Таких безжалостно пропускаем.
в) Иногда в качестве "конкурентов" на фамилию выступают неожиданные национальности - башкиры, узбеки, даже армяне и грузины. Поскольку они, видимо, не будут конкурентами за имена, их стоит тоже отбросить - пусть у нас будут только евреи и славяне.
г) Если фамилия редкая, то стоит проверить другие источники. Списки Мемориала, Подвиг Народа, и т.д. Хотя бы десяток независимых носителей желательно иметь.

3. Имена и отчества.
А) Есть несколько групп имён, по принадлежности к которым мы можем оценить вероятность того, что его носитель - еврей.
а) Имена, которые при любых условиях могут быть только еврейскими: Мендель, Бер, Борух, Менахем, Хаим, и т.д. - многие десятки мужских и женских имён.
б) Библейские имена, которые в наши времена почти исключительно принадлежат евреям, но в прошлом они были вполне распространены среди славян: Моисей, Абрам, Исаак.
в) Имена, которые стали в наши времена много более распространены среди евреев по причине того, что они заменили собой настоящие еврейские имена, но в прошлом не имели хождения среди евреев: Лев, Марк, Зиновий.
г) Русские имена, которые сегодня довольно часто принадлежат евреям, имея относительную частоту заметно выше единицы: Евгений, Леонид, Борис, Григорий, Михаил.
д) Нейтральные на сегодня русские имена; такие, чья относительная частота близка к единице: Александр, Владимир, Юрий, и т.д. За исключением Александра, в прошлом они евреями не употреблялись.
е) Русские имена, которые до сих пор достаточно редки среди евреев (относительная частота заметно ниже единицы): Иван, Фёдор, Василий.
Б) Если хочется поточнее определиться с тем или иным именем, всё та же ОБД поможет произвести такой расчёт. По счастью, записи там раскиданы в полном беспорядке, что делает возможным пролистать десяток страниц и сделать приличную оценку.

4) Инициалы.
Очень трудно оценить вероятность по инициалам, особенно если неизвестен пол. В таком случае инициалы следует исключить из рассмотрения - они ничего не дадут. В редких случаях отностительная частота может заметно отличаться от единицы:
А) Имена, начинающиеся на Х, Ш, Ц, а также З (у мужчин), будут скорее еврейскими, чем русскими. А вот старая русская буква Ѳ (фита), скорее всего, принадлежала Фёдору и точно нееврею.
Б) Двойное имя - сильный аргумент в пользу евреев. Восточные славяне двойных имён не использовали.

5) Другие критерии.
А) Отчество совпадает с именем. Сильный аргумент против евреев. Только если отец умер до рождения сына, его могли назвать в честь отца.
Б) Сословие. Евреи были почти исключительно мещанами, если не купцами. Любое другое сословие - аргумент против.
В) Приписка. Если в документе есть приписка, то она может нам кое-что подсказать. Скажем, самарский мещанин с куда меньшей вероятностью еврей, чем гродненский. Опять же, за цифрами идём в Демоскоп.

Аватара пользователя
anno_nin
Сообщения: 6029
Регистрация: 01.07.2010
Откуда: Ашдод, Израиль
Благодарил (а): 1180 раз
Поблагодарили: 1219 раз

Re: Вероятностные подходы к идентификации евреев

#33 Сообщение anno_nin » 07 июл 2012, 13:45

Юлия_П писал(а):Согласитесь, что у Сапожникова Леонида Борисовича больше шансов оказаться евреем, чем у Сапожникова Леонида Ивановича или Ивана Борисовича. Так что тут всё совсем не так просто.
Опять же. Вероятность у Сапожникова Леонида Борисовича - мещанина небольшого местечка в ЧО в середине 19-го века - оказаться евреем гораздо меньше, чем у его полного тёзки-студента университета в 1910 году.

Попутно вопрос: Борис Исаакович Сапожников 1890 г.р. крестился в 1905г. В качестве отчества получил имя крестного отца и стал Борисом Ивановичем. Это имя находим, скажем, в телефонном справочнике Москвы. Еврей? нет. А корни еврейские... Вносить?

Аватара пользователя
Юлия_П
Администратор
Сообщения: 11687
Регистрация: 17.07.2009
Откуда: Одесса-Украина
Благодарил (а): 1079 раз
Поблагодарили: 1572 раза

Re: Вероятностные подходы к идентификации евреев

#34 Сообщение Юлия_П » 07 июл 2012, 14:06

anno_nin писал(а):
Юлия_П писал(а):Согласитесь, что у Сапожникова Леонида Борисовича больше шансов оказаться евреем, чем у Сапожникова Леонида Ивановича или Ивана Борисовича. Так что тут всё совсем не так просто.
Опять же. Вероятность у Сапожникова Леонида Борисовича - мещанина небольшого местечка в ЧО в середине 19-го века - оказаться евреем гораздо меньше, чем у его полного тёзки-студента университета в 1910 году.

Попутно вопрос: Борис Исаакович Сапожников 1890 г.р. крестился в 1905г. В качестве отчества получил имя крестного отца и стал Борисом Ивановичем. Это имя находим, скажем, в телефонном справочнике Москвы. Еврей? нет. А корни еврейские... Вносить?
Не травите душу :( . Я Ивановичей не вношу, хотя и предполагаю, что чисто теоретически кого-то так могу потерять.
Захарин - Полоцк (Витебская губерния), Ковно, Харьков
Кацев - Ушачи, Лепель, Полоцк (Витебская губерния), Харьков

База данных Архивные ссылки searchdb_form.php

Аватара пользователя
Юлия_П
Администратор
Сообщения: 11687
Регистрация: 17.07.2009
Откуда: Одесса-Украина
Благодарил (а): 1079 раз
Поблагодарили: 1572 раза

Re: Вероятностные подходы к идентификации евреев

#35 Сообщение Юлия_П » 07 июл 2012, 15:08

Можно я немного попридираюсь?
JorgeDelCaminoReal писал(а):б) Не всегда удаётся ответить на вопрос еврей-нееврей.
Так там в основном будут русифицированные имена.
JorgeDelCaminoReal писал(а):в) Иногда в качестве "конкурентов" на фамилию выступают неожиданные национальности - башкиры, узбеки, даже армяне и грузины. Поскольку они, видимо, не будут конкурентами за имена, их стоит тоже отбросить - пусть у нас будут только евреи и славяне.
А у меня основные конкуренты - поляки (всякие Иосифы) и немцы :( . Если от русских я худо-бедно отличать научилась, то что делать с остальными - не знаю.

JorgeDelCaminoReal писал(а):д) Нейтральные на сегодня русские имена; такие, чья относительная частота близка к единице: Александр, Владимир, Юрий, и т.д. За исключением Александра, в прошлом они евреями не употреблялись.
По поводу Александра Бейдер мне сделал уже замечание. Он уверяет, что Александр - еврейское имя.

JorgeDelCaminoReal писал(а):Б) Двойное имя - сильный аргумент в пользу евреев. Восточные славяне двойных имён не использовали.
Ох, а как же быть с теми же немцами? У них двойные имена тоже сплошь и рядом, причём Яков, Иосиф, Абрам были очень даже в ходу, а евреи брали немецкие имена.

JorgeDelCaminoReal писал(а):А) Отчество совпадает с именем. Сильный аргумент против евреев. Только если отец умер до рождения сына, его могли назвать в честь отца.
А не могло ли свопадение возникнуть при русификации разных еврейских имён?
JorgeDelCaminoReal писал(а):Б) Сословие. Евреи были почти исключительно мещанами, если не купцами. Любое другое сословие - аргумент против.
А земледельцы? Кстати, есть ещё один термин - колонист. Так вот, замечено, что колонистами называли чаще немцев, а евреев - земледельцами, хотя и те, и другие жили в аналогичных земледельческих колониях.
Захарин - Полоцк (Витебская губерния), Ковно, Харьков
Кацев - Ушачи, Лепель, Полоцк (Витебская губерния), Харьков

База данных Архивные ссылки searchdb_form.php

Любовь Гиль
Сообщения: 2597
Возраст: 71
Регистрация: 23.11.2011
Откуда: Беэр-Шева, Израиль
Благодарил (а): 1693 раза
Поблагодарили: 771 раз

Re: Вероятностные подходы к идентификации евреев

#36 Сообщение Любовь Гиль » 07 июл 2012, 20:24

Уважаемый Игорь или Jorge!
СПАСИБО большое за прекрасное решение очень интересной и важной задачи.
Интересуют:
Абрамские - Мосты Гродненской губ., Таврическая губ., в т.ч. Каховка, Херсон, Одесса
Шар(о)городские - Перекоп, Армянский базар (Армянск),Таврическая,Херсонская, Киевская губ., Подолье
Зайцовы/Зайцевы - Херсон, Херсонская и Таврическая губ., Каховка, Берислав, Могилев и др.
Уманские - Таврическая и Херсонская губ., Херсон, Алешки и др.
Боград - Сенно Могилевской губ., Херсон, Херсонская губ., в т.ч. еврейские колонии - Новоковно, Добрая и др.
Блох - Россиены Ковенской губ., Херсон, Николаев
Фельдман - Херсон, Николаев
Куперман - Николаев
Гиль - Янушполь (ранее Иванополь) Житомирск.
Бенционовы, Фишман - Екатеринослав

Аватара пользователя
Jorge
Сообщения: 6205
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 186 раз

Re: Вероятностные подходы к идентификации евреев

#37 Сообщение Jorge » 08 июл 2012, 10:16

Спасибо всем за реакцию и замечания. Частично я отражу их в инструкции. Но по многим вопросам вы бежите впереди паровоза (меня). И это, вероятно, хорошо. Пока что наша модель включала ровно две взаимоисключающие гипотезы, например, еврей или русский. Эта модель неплохо описывает некоторые случаи. Но реальная жизнь сложнее. Например, как указала Нина, могут быть 3 гипотезы - русский, еврей крещёный и обычный. Или, как упоминает Юля, в игру могут вступить немцы и поляки.

Над этой задачей я сейчас работаю.

Аватара пользователя
Файнгольд Татьяна
Сообщения: 2359
Регистрация: 20.09.2009
Откуда: Винница-Хайфа
Благодарил (а): 738 раз
Поблагодарили: 779 раз

Re: Вероятностные подходы к идентификации евреев

#38 Сообщение Файнгольд Татьяна » 08 июл 2012, 11:08

Имеет значение также временной период.
До Советской власти и при ней.
Так близкий мне человек носил имя Шимон, отец его был Шломо, во всех советских документах он был Семен Семенович.
Фамилия его явно еврейская, но при фамилии, которая могла принадлежать нескольким национальностям, сведения о нем должны быть пропущены.
Я сейчас работаю с описями Каменец-Подольского суда за 187...годы.
Там встречаются записи, по которым трудно однозначно определить, о ком речь.
Особенно если учесть, что тогда там проживало польское население.
Я включаю всех "подозрительных", мне жаль кого-нибудь потерять.
Конечно, при обработке ВСЕХ записей архива, такой вопрос не поднимался бы.
Но поскольку для нас важны только еврейские корни, приходится выбирать.
Еще раз спасибо, Игорь, за интересную тему.
В последнее время это большая редкость.
ФАЙНГОЛЬД
КАМЕНЕЦ-ПОДОЛЬСКИЙ
м.СМОТРИЧ

Аватара пользователя
anno_nin
Сообщения: 6029
Регистрация: 01.07.2010
Откуда: Ашдод, Израиль
Благодарил (а): 1180 раз
Поблагодарили: 1219 раз

Re: Вероятностные подходы к идентификации евреев

#39 Сообщение anno_nin » 08 июл 2012, 11:26

JorgeDelCaminoReal писал(а):Спасибо всем за реакцию и замечания. Частично я отражу их в инструкции. Но по многим вопросам вы бежите впереди паровоза (меня). И это, вероятно, хорошо. Пока что наша модель включала ровно две взаимоисключающие гипотезы, например, еврей или русский. Эта модель неплохо описывает некоторые случаи. Но реальная жизнь сложнее. Например, как указала Нина, могут быть 3 гипотезы - русский, еврей крещёный и обычный. Или, как упоминает Юля, в игру могут вступить немцы и поляки.
Над этой задачей я сейчас работаю.

Золушкин труд. :)
А что делать, к примеру, с субботниками (и аналогичными религиозными группами)? У них имена еврейские. И традиции наречения похожие. Фамилии вроде бы славянские, но... Фамилии Липкин и Зеленько (Зеленко), к примеру, оказались еврейскими... (кто бы мог подумать!)
Во время и после революции еще и смешаные браки (бабушка Оля точно еврейка, но ее фамилии никто уже не помнит). Ну, этот вариант придется отбросить до выяснения бабушкиной фамилии.

oztech
Сообщения: 4117
Возраст: 69
Регистрация: 01.09.2009
Откуда: Санкт-Петербург
Благодарил (а): 173 раза
Поблагодарили: 1127 раз

Re: Вероятностные подходы к идентификации евреев

#40 Сообщение oztech » 10 июл 2012, 02:28

Многое, что хотел добавить к обсуждаемой теме, уже прозвучало, но все равно поделюсь.
Итак, мне очень нравятся красивые решения, не только математических задач, но и в технике, дизайне, головоломках, да, мало ли где. Я даже подумал, может, стоит во всем этом разобраться, чтобы прочувствовать весь цимес (раз случайно попал в высокое общество, где все накоротке с Байесом, так надо бы соответствовать), но...
Возник наивный вопрос: пусть все выкладки верны, и что? Что это дает для практики генеалогических исследований? Похоже, что ничего не дает, а в некотором смысле даже вредит им. Не верите? Судите сами.
Многим, наверное, как и мне, в поиске новых источников генеалогической информации попадались статистические данные. Что-то даже было интересно прочитать, но не могу вспомнить ни единого случая, чтобы статистика оказалась хоть в чем-то полезной для лично моей работы. Вот, когда сухую цифирь размачивали конкретными именами и фамилиями, т.е. отходили от канонов, то появлялись зацепки и свежие идеи для новых направлений поиска. Но это только подтверждает мысль, что сама-то статистика совсем не дружит с генеалогией.
Теперь, вот, статистика собирается дать инструмент для формирования выборок. Мне хорошо понятна достаточно нудная работа по оцифровке документов, но я, ведь, и с другой стороны барьера бываю. Кто-то оцифровал недоступный мне документ, конечно, спасибо добровольному помощнику, только, если я не нахожу интересующего меня материала, то волей-неволей возникает мысль, не попал ли он под слепую статистическую секиру? Вот, скажем, мать моего дяди Моисея в семье звали Рахиль. А по найденным мною в базе Мемориала документам ее девичья фамилия оказалась Белова. Полагаю, что у семьи Беловых из брянской глухомани очень много шансов не попасть в выборку, благословленную Байесом, Стьюдентом или хи-квадратом.
Нет, конечно, красивое решение - это здорово, но, может, не будем торопиться его внедрять?
Григорий


Вернуться в «Еврейские фамилии. Справочники и обсуждение»

Кто сейчас на конференции

Сейчас этот форум просматривают: albeider, Google Adsense [Bot] и 4 гостя