Вероятностные подходы к идентификации евреев

Модератор: MOCKBA

Сообщение
Автор
yvb
Сообщения: 3972
Регистрация: 16.07.2009
Благодарил (а): 122 раза
Поблагодарили: 366 раз
Контактная информация:

Re: Вероятностные подходы к идентификации евреев

#41 Сообщение yvb » 10 июл 2012, 06:22

Я раньше намекал на Остапа Бендера и "Двенадцать стульев", как на классический пример того, к чему приводит вероятностный подход. Увлекательные приключения, великие комбинации, масса потраченных сил и времени, а в результате - ноль: единственный стул с драгоценностями был исключён из поисков :) .
База данных «Жители Кременчуга и Кременчугского уезда» - www.kremenchug.su

Леонид
Сообщения: 678
Регистрация: 09.02.2010
Благодарил (а): 973 раза
Поблагодарили: 106 раз

Re: Вероятностные подходы к идентификации евреев

#42 Сообщение Леонид » 10 июл 2012, 10:52

yvb писал(а):Я раньше намекал на Остапа Бендера и "Двенадцать стульев", как на классический пример того, к чему приводит вероятностный подход. Увлекательные приключения, великие комбинации, масса потраченных сил и времени, а в результате - ноль: единственный стул с драгоценностями был исключён из поисков :) .

:good:

Аватара пользователя
Jorge
Сообщения: 6213
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 185 раз

Re: Вероятностные подходы к идентификации евреев

#43 Сообщение Jorge » 10 июл 2012, 13:32

oztech писал(а):Многое, что хотел добавить к обсуждаемой теме, уже прозвучало, но все равно поделюсь.
Итак, мне очень нравятся красивые решения, не только математических задач, но и в технике, дизайне, головоломках, да, мало ли где. Я даже подумал, может, стоит во всем этом разобраться, чтобы прочувствовать весь цимес (раз случайно попал в высокое общество, где все накоротке с Байесом, так надо бы соответствовать), но...
Возник наивный вопрос: пусть все выкладки верны, и что? Что это дает для практики генеалогических исследований? Похоже, что ничего не дает, а в некотором смысле даже вредит им. Не верите? Судите сами.
Многим, наверное, как и мне, в поиске новых источников генеалогической информации попадались статистические данные. Что-то даже было интересно прочитать, но не могу вспомнить ни единого случая, чтобы статистика оказалась хоть в чем-то полезной для лично моей работы. Вот, когда сухую цифирь размачивали конкретными именами и фамилиями, т.е. отходили от канонов, то появлялись зацепки и свежие идеи для новых направлений поиска. Но это только подтверждает мысль, что сама-то статистика совсем не дружит с генеалогией.
Теперь, вот, статистика собирается дать инструмент для формирования выборок. Мне хорошо понятна достаточно нудная работа по оцифровке документов, но я, ведь, и с другой стороны барьера бываю. Кто-то оцифровал недоступный мне документ, конечно, спасибо добровольному помощнику, только, если я не нахожу интересующего меня материала, то волей-неволей возникает мысль, не попал ли он под слепую статистическую секиру? Вот, скажем, мать моего дяди Моисея в семье звали Рахиль. А по найденным мною в базе Мемориала документам ее девичья фамилия оказалась Белова. Полагаю, что у семьи Беловых из брянской глухомани очень много шансов не попасть в выборку, благословленную Байесом, Стьюдентом или хи-квадратом.
Нет, конечно, красивое решение - это здорово, но, может, не будем торопиться его внедрять?
Уважаемый Григорий!

Для меня весьма лестно, что мне удалось привлечь Ваше внимание к затеянной мною дискуссии. Ваши сомнения понятны; они действительно здесь неоднократно звучали. Я бы разбил их на две группы, на которые отвечу по очереди.
1. Вероятностные методы не нужны (по крайней мере, в генеалогии), т.к. они не могут дать точный результат, и в реальности всё может оказаться не так, как предсказано.
2. Предложенная формула не может правильно предсказать результат.

Слов нет, вероятностные методы не нужны, когда есть точное детерминированное решение задачи. Проблема начинается там, где такого решения в принципе нет, и это случается в подавляющем большинстве случаев. И здесь приходит на помощь статистика. Она учит, что, если одинаковые эксперименты повторять много раз, то средний результат стремится к определённому значению, а разброс к нулю. В этом смысле при обработке достаточно больших экспериментальных массивов можно говорить, что статистика даёт точный результат.

Когда с горы скатывается колесо, Вы можете точно рассчитать его ускорение, скорость и время спуска. А если сыпется песок, можете ли Вы рассчитать траекторию каждой песчинки? Увы. А можно ли оценить время осыпания при помощи статистических подходов? Зачастую, да. Когда-то в позапрошлой жизни я написал дипломную работу о движении сыпучего материала в наклонной вращающейся трубе. Было рассчитано среднее время движения материала по трубе и его разброс. С помощью замечательных стариков-механиков, работавших тогда на кафедре, я соорудил экспериментальную установку. Результаты экспериментов полностью подтвердили мои теоретические построения. Возможно, та моя работа теперь используется в цементной промышленности.

Вы, как я понял, были хорошим стьюдентом и помните начала термодинамики. Навряд ли их бы удалось открыть, рассчитывая траектории отдельных частиц. Молекулярная физика, физика элементарных частиц, химия, социология, метеорология не ушли бы далеко, если бы вместо статистических закономерностей искали, как будут вести себя отдельные элементы. Похоже, что лишь литература не подчиняется законам статистики. Каждый второй автор помещает своих героев в обстоятельства, вероятность которых в реальной жизни исчезающе мала. Поэтому попытки отдельных участников аргументировать свой скептицизм по отношению к статистике ссылкой на литературные произведения не имеют к настоящей теме ни малейшего отношения.

Касательно генеалогии. Я привёл несколько конкретных примеров, когда вероятностный подход помогает в решении наших задач. Могу привести другие, тоже конкретные примеры. Ваши возражения звучат несколько абстрактно. Вы говорите, что Вы сталкивались с некими статистическими данными, но они Вам никогда не помогали. Ну, бывает. А другим помогали.

Теперь Вы, конечно, хотели бы знать, как моя формула могла бы помочь оценить вероятность того, что Ваша бабушка - еврейка и, соответственно, не будет выброшена из нашей еврейской базы данных. Немного странно слышать такие сомнения от Вас после того, как мы увидели, что мой подход может дать в 930 раз большую, чем Ваш, вероятность того, что сомнительная запись выброшена не будет (а в терминах относительной вероятности - в 13 тысяч раз!). Но давайте посмотрим. Позвольте предположить, что Ваша бабушка была из одного из уездных городков Мглин, Новозыбков, Стародуб и Сураж, а, если не из них, то из окрестных местечек или городков Погар, Почеп, Клинцы, Климово, Унеча, Попова Гора, Новое Место. Там жило подавляющее число евреев той территории, которая ныне является Брянщиной. Так вот, до революции в Новозыбкове четверть была евреями, в Мглине - треть, в Стародубе - 40%, а в Сураже - 60! Вот такая себе брянская глухомань. Если "помножить" на близкую к 100% вероятность того, что Рахиль - еврейка (в жизни не встречал русских Рахилей), то станет понятно, что выбросить такую Рахиль будет непросто. Что касается фамилии Белов, она есть у Бейдера, причём именно-таки в Черниговской губернии. Посчитать вероятность того, что Белов - еврей, непросто: в ОБД очень много Беловых, и искать там уроженцев наших уездов нелегко. В первых трёх тысячах встретилось 3 человека (кажется, русские). Похоже, эта фамилия была не очень частой и у русских в тех краях. Ну, прикинем. Евреев до революции было 4%. В предположении, что бабушка из одного из названных городов, имеем 40% евреев. Предположив, что она - Рахиль, имеем, допустим, 95% евреек. Наконец, вероятность того, что Белов - еврей, будет, допустим, 0.01%. Для относительной вероятности получаем 1/24 * (2/3 / (1/24)) * (19 / (1/24)) * (1/9999 / (1/24)) = 0.73. То была относительная вероятность, а обычная - 42%. С такой высокой вероятностью еврейства я ни за что бы не выбросил Вашу бабушку!

Аватара пользователя
anno_nin
Сообщения: 5405
Регистрация: 01.07.2010
Откуда: Ашдод, Израиль
Благодарил (а): 970 раз
Поблагодарили: 966 раз

...и статистика

#44 Сообщение anno_nin » 11 июл 2012, 08:12

Вот и статейка подвернулась по теме:
http://vovizrt2008.narod.ru/Ivanovy.html
Сколько Ивановых живет в Израиле?
Не первый год живя на Земле Обетованной, такого я все-таки не ожидал. Раскрыв однажды телефонный справочник Тель-Авива на букву "алеф" - первую букву ивритского алфавита- я увидел целый столбец "Ивановых".
Конечно, я и раньше знал, что в Израиль в составе семей с просторов бывшего СССР прибыли не только Рабиновичи и Шапиро. В конце концов, фамилия моего бывшего соседа, пишущего неплохие стихи, Анпилов. И, представьте себе, он тезка лидера "Трудовой России", потому что зовут его тоже Виктор. Правда, по отчеству он не Иванович, а Александрович.

И тем не менее, целый столбец тель-авивских Ивановых в телефонном справочнике, не мог меня не удивить. Все-таки, прямо скажем, - это не самая распространенная еврейская фамилия. Мое журналистское любопытство, естественно, взыграло до немалых высот. Мне ничего не оставалось делать, как попытаться его удовлетворить. Звоню, наугад, одному из тель-авивских Ивановых. Понятное дело, извиняюсь за беспокойство, представляюсь... И все это на "великом и могучем"! А как же иначе? С Ивановым же я в беседу вступаю! А в ответ слышу совершенно неожиданное: "Слиха, иврит о англит", то есть: "Извините, уважаемый! Не понимаю, перейдите, пожалуйста, на иврит или английский!" Я ушам своим не поверил! Как же так? Иванов, а по-русски не говорит! Разве подобное бывает? Но делать нечего, пришлось перейти на библейский язык, ибо посчитал себя просто обязанным выяснить, почему человек с самой, что ни на есть, русской фамилией не знает русского языка.

На другом конце провода тоже весьма любезно представились: "Гилад Иванов, строительный подрядчик". Выяснилось, что прадед Гилада прибыл на земли палестинские из Гельсингфорса (нынешние Хельсинки) еще в далеком 1920 году. Разметала Гражданская война граждан бывшей Российской империи не только по европейским столицам! Звали прадеда Гилада Владимиром, и был он не то недоучившимся инженером, не то офицером. Хотя вполне может быть, что и тем и другим одновременно. Конечно, Владимир прекрасно владел русским языком. Но на Земле Обетованной женился на местной девушке, и на языке Пушкина и Гоголя уже с трудом изъяснялся его сын. Интересно, что прадед Гилада не пошел "в ногу с тем временем" и не поменял фамилию на ивритский лад, а вот имя по моде тех лет все-таки изменил. И стали именовать его Зеевом. По словам Гилада, Зеев до конца жизни занимал инженерную должность в киббуце и считал себя "социалистом". Больше о своем предке Гилад Иванов ничего вспомнить не смог.
Намного лучше свою родословную знают израильские Агеевы, Орловы, Матвеевы, Куракины, Дубровины, Филины, Адамовы. Потому что представители этих семей - фигуры в немалой степени исторические.
...
(Дальше идет рассказ о конкретных людях, прошедших гиюр, но фамилии не сменивших).
Я все это к тому веду, что при любой формуле в базу часть "Иосифов" попадет по ошибке, а часть "Алексеев" окажется за бортом.
Низкий поклон составителям баз за титанический труд.
А исследователям конкретных родословных стоит об этом не забывать.

Аватара пользователя
Jorge
Сообщения: 6213
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 185 раз

Re: Вероятностные подходы к идентификации евреев

#45 Сообщение Jorge » 11 июл 2012, 12:25

Я, похоже, дезориентировал участников дискуссии примером, связанным с современной Москвой. Конечно, моя теория для современности не предназначена и не годится. В самом деле, взяв любую сколь угодно нееврейскую фамилию - допустим, Иванов, после нескольких поколений жизни в стране пролетарского интернационализма, какова вероятность того, что этот Иванов хоть каким-то боком (в частности, через жену) подпадает под закон о возвращении? Если он ещё и из большого города и с высшим образованием, то такая вероятность довольно некрохотная. Предполагаю, что мои оценки вероятности можно было бы использовать как математическое ожидание процента еврейской крови. Но развивать тему в этом направлении мне не хотелось бы.

Аватара пользователя
anno_nin
Сообщения: 5405
Регистрация: 01.07.2010
Откуда: Ашдод, Израиль
Благодарил (а): 970 раз
Поблагодарили: 966 раз

Re: Вероятностные подходы к идентификации евреев

#46 Сообщение anno_nin » 11 июл 2012, 14:13

Разговор в вагоне-ресторане

"...
И пошел я к Львовой Клавке:
– Будем, Клавка, выручать,
Оформляй мне, Клавка, справки,
Шлепай круглую печать!

Значит, имя, год рожденья,
Званье, член КПСС.
Ну, а дальше – наважденье,
Вроде вдруг попутал бес.

В состоянии помятом
Говорю для шутки ей, –
– Ты, давай, мол, в пункте пятом
Напиши, что я еврей!

Посмеялись и забыли,
Крутим дальше колесо,
Нам все это, вроде пыли,
Но совсем не вроде пыли
Дело это для ОСО!

Вот прошел законный отпуск,
Начинается мотня.
Первым делом, сразу «допуск»
Отбирают у меня,

И зовет меня Особый,
Начинает разговор, –
– Значит, вот какой особой,
Прямо скажем, хитрожопой!
Оказался ты, Егор!

Значит все, мы кровь на рыле,
Топай к светлому концу!
Ты же будешь в Израиле
Жрать, подлец, свою мацу!

Мы стоим за дело мира,
Мы готовимся к войне!
Ты же хочешь, как Шапиро,
Прохлаждаться в стороне!

Вот зачем ты, вроде вора,
Что желает – вон из пут,
Званье русского майора
Променял на «пятый пункт».

Я ему, с тоской в желудке,
Отвечаю, еле жив, –
– Это ж я за ради шутки,
На хрена мне Тель-Авив!

Как он гаркнет: – Я не лапоть!
Поищи-ка дурачков!
Ты же явно хочешь драпать!
Это ж видно без очков!

Если ж кто того не видит,
Растолкуем в час-другой,
Нет, любезный, так не выйдет,
Так не будет, дорогой!

Мы тебя – не то что взгреем,
Мы тебя сотрем в утиль!
Нет, не зря ты стал евреем!
А затем ты стал евреем,
Чтобы смыться в Израиль!

И пошло тут, братцы-други,
Хоть ложись и в голос вой!..
Я теперь живу в Калуге,
Беспартийный, рядовой!

Мне теперь одна дорога,
Мне другого нет пути:
– Где тут, братцы, синагога?!
Подскажите, как пройти"

oztech
Сообщения: 3673
Возраст: 69
Регистрация: 01.09.2009
Откуда: Санкт-Петербург
Благодарил (а): 141 раз
Поблагодарили: 919 раз

Re: Вероятностные подходы к идентификации евреев

#47 Сообщение oztech » 15 июл 2012, 18:46

Хочу еще раз вернуться к этой почти исчерпанной теме, поскольку, видимо, был недостаточно точен в формулировках, и, соответственно, неправильно понят.
На мое:
oztech писал(а):... сама-то статистика совсем не дружит с генеалогией.
Последовало:
JorgeDelCaminoReal писал(а):Ваши сомнения понятны; они действительно здесь неоднократно звучали. ... Вероятностные методы не нужны (по крайней мере, в генеалогии), т.к. они не могут дать точный результат, и в реальности всё может оказаться не так, как предсказано.

Слов нет, вероятностные методы не нужны, когда есть точное детерминированное решение задачи. Проблема начинается там, где такого решения в принципе нет, и это случается в подавляющем большинстве случаев. И здесь приходит на помощь статистика.

Да, я, можно сказать, трепетно люблю статистику и постоянно ею пользуюсь на работе, но одно дело - статистика в точных науках, и совсем другое - в описательных дисциплинах, таких как история, литература, ну, и генеалогия (кстати, это все, ведь, и не науки даже). Принципиально важно, какие задачи ставить перед статистикой в генеалогии.
oztech писал(а):Что это (расчет вероятности события - прим. мое Г.Ш.) дает для практики генеалогических исследований?
Теперь, вот, статистика собирается дать инструмент для формирования выборок.

Есть задача, с которой сталкиваются практически все исследователи генеалогии. Носитель исследуемой фамилии - однофамилец или родственник? Можно ли рассчитать статистическую вероятность родства при отсутствии прямых документальных подтверждений? Какие для этого нужны исходные данные, например, по региону распространения фамилии, еще каким-то сведениям, которыми занимается статистика или демография? Например, у меня по Невелю клубков пять ветвей генеалогических деревьев, которые никак не вяжутся друг с другом. Можно ли как-то оценить вероятность полного или частичного объединения этих ветвей в единое древо?
JorgeDelCaminoReal писал(а):Когда-то в позапрошлой жизни я написал дипломную работу о движении сыпучего материала в наклонной вращающейся трубе. ... Возможно, та моя работа теперь используется в цементной промышленности.

Если эта работа опубликована, пришлите, пожалуйста, ссылку в личку. Для расчета времени пребывания материала во вращающихся аппаратах формул много, может, и Ваша окажется полезной.
Григорий

Аватара пользователя
Jorge
Сообщения: 6213
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 185 раз

Re: Вероятностные подходы к идентификации евреев

#48 Сообщение Jorge » 15 июл 2012, 20:02

oztech писал(а):Хочу еще раз вернуться к этой почти исчерпанной теме
Я рад, что Вы захотели к ней вернуться, хотя я, например, вовсе не считал её исчерпанной. Бьюсь над задачей о более, чем двух независимых событиях, чью условную вероятность нужно оценить. Как решу, опубликую.

oztech писал(а):одно дело - статистика в точных науках, и совсем другое - в описательных дисциплинах, таких как история, литература, ну, и генеалогия (кстати, это все, ведь, и не науки даже).
Статистика - она одна и та же, а для чего её использовать - здесь в каждой науке особый разговор. Я попытался использовать её в области генеалогии и ономастики и вижу, что моя попытка нашла живой отклик.

oztech писал(а):Есть задача, с которой сталкиваются практически все исследователи генеалогии. Носитель исследуемой фамилии - однофамилец или родственник? Можно ли рассчитать статистическую вероятность родства при отсутствии прямых документальных подтверждений? Какие для этого нужны исходные данные, например, по региону распространения фамилии, еще каким-то сведениям, которыми занимается статистика или демография? Например, у меня по Невелю клубков пять ветвей генеалогических деревьев, которые никак не вяжутся друг с другом. Можно ли как-то оценить вероятность полного или частичного объединения этих ветвей в единое древо?
Спасибо. Похоже на то, что это действительно важное приложение для моей теории. Есть 2 гипотезы - родственник или однофамилец, и требуется оценить вероятности. Осталось подобрать критерии и оценить вероятности.

oztech писал(а):Если эта работа опубликована, пришлите, пожалуйста, ссылку в личку. Для расчета времени пребывания материала во вращающихся аппаратах формул много, может, и Ваша окажется полезной.
Не знаю точно. Мой руководитель готовил статью к публикации в академичесом журнале, но чем оно закончилось, я не уверен. На кафедре велись исследования по теме, так что, возможно, они мою работу как-то использовали. Сама работа должна храниться в архиве на ул.Хлопина; можно заказать. На момент, когда я к ней приступал, формулы, использовавшиеся в промышленности, были неправильны, то есть неверно описывали зависимость от параметров.

oztech
Сообщения: 3673
Возраст: 69
Регистрация: 01.09.2009
Откуда: Санкт-Петербург
Благодарил (а): 141 раз
Поблагодарили: 919 раз

Re: Вероятностные подходы к идентификации евреев

#49 Сообщение oztech » 15 июл 2012, 22:56

Про статью могу сказать, что, если Вы ее не найдете, то и никто не найдет. Будем считать свои печи и сушилки по неверным формулам. Хотя к расчету времени пребывания у проектировщиков отношение довольно наплевательское.
Григорий

Аватара пользователя
Jorge
Сообщения: 6213
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 185 раз

Re: Вероятностные подходы к идентификации евреев

#50 Сообщение Jorge » 18 июл 2012, 08:16

Понимаете, работа на кафедре продолжалась, мой вклад они собирались использовать - надеюсь, что так и вышло. Кажется, свою работу они внедряли в Новороссийске. Параллельно готовилась статья. Чем это кончилось - спросить, к сожалению, уже не у кого. Как это обычно бывает, меня тогда уже занимали другие задачи. Никогда не думал, что моя скромная работа когда-нибудь заинтересует солидных людей. Если хотите, можно заказать мой дипломный проект в архиве. Он там 50 лет должен храниться.

Аватара пользователя
Файнгольд Татьяна
Сообщения: 2223
Регистрация: 20.09.2009
Откуда: Винница-Хайфа
Благодарил (а): 643 раза
Поблагодарили: 636 раз

Re: Вероятностные подходы к идентификации евреев

#51 Сообщение Файнгольд Татьяна » 31 июл 2012, 20:51

Как выдумаете, нужно ли этого "рядового" вносить в базу данных?
У вас нет необходимых прав для просмотра вложений в этом сообщении.
ФАЙНГОЛЬД
КАМЕНЕЦ-ПОДОЛЬСКИЙ
м.СМОТРИЧ

Аватара пользователя
Jorge
Сообщения: 6213
Регистрация: 16.07.2009
Откуда: Санкт-Петербург
Поблагодарили: 185 раз

Re: Вероятностные подходы к идентификации евреев

#52 Сообщение Jorge » 03 авг 2012, 11:48

Файнгольд Татьяна писал(а):Как выдумаете, нужно ли этого "рядового" вносить в базу данных?
Без какой бы то ни было связи с этой темой, думаю, что дела о переходе в иудаизм интересны для нашей базы данных. Даже с чисто исторической точки зрения - это очень редкое явление, поскольку российский закон сурово карал за это "преступление" как "совращённого", так и "совратителя", и последний не мог об этом не знать. Конечно, времена Возницына и Борхова уже ушли в прошлое, но тем не менее Сибирь обоим была обеспечена. После отбытия наказания евреям предоставлялась возможность остаться в Сибири, которой многие пользовались. Там они могли обзавестись семьёй (возможно, найдя жену из калмычек - закон не препятствовал переходу из одной нехристианской веры в другую), и их потомки тоже считались евреями. Возможно, кто-то из потомков того Ивана Пилина присутствует на нашем форуме, а Бейдер ломает голову над этимологией этой "еврейской" фамилии (впрочем, он непременно имеет на любой случай жизни хорошую гипотезу или даже две).


Вернуться в «Еврейские фамилии. Справочники и обсуждение»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя