מאגר שמות ישראליים בעברית – Israeli hebrew names dataset

זהו פוסט ראשון בבלוג בעברית, מאחר והוא דן בנושא שמות ישראליים בעברית. לאחרונה יצא לי להתעסק בכריית שמות מדפי אינטרנט ומהר הבנתי שלא אתקדם הרבה אם לא תהיה לי רשימת מילים שהן למעשה שמות, כדי להפריד בקלות את הטקסט מהשמות.
לא מצאתי רשימה כזו פשוטה, למרות שבאתר מ.י.ל.ה של הטכניון יש לקסיקון די נרחב של מילים בעברים עם טיוג גם לשמות. למרות שאפשר בקלות לדלות משם את השמות עם JAXB על הסכמה של הXML, לא עשיתי זאת מפאת חוסר זמן וקוצר רוח.
אז עשיתי רשימה בעצמי. התחלתי ממאגר שמות שקיים אצלי ופירקתי לשם פרטי ומשפחה באמצעות רווחים, ולאחר מכן התחלתי במלאכת הכרייה שהוסיפה הרבה מאוד שמות למאגר.
לאחר מכן חזרתי למאגר שלי ומניתי את המופעים של כל שם כשם פרטי ושם משפחה, כדי לעזור בכרייה עתידית. כך אפשר למצוא עוד שמות למשל אם לוקחים את המילה שבאה לפני שם משפחה מובהק מאוד.
עם זאת ישנם שמות מאוד מבלבלים מבחינת שיוך לשם פרטי או משפחה, למשל “גל”, “שלום”, או “ברק”. לעומתם שמות מובהקים לכאן או לכאן כמו “אהוד” או “לוי”
בכל מקרה, הנה הרשימה לשימושכם החופשי.
נא לקחת בחשבון שזו רשימה חלקית ביותר, וכן המנייה של השמות חלקית ביותר גם היא.
This is the first hebrew speaking post on the MTT blog, since it speaks of names in Hebrew. This is also not a translation of the above text, just a preamble to it. I’ve collected a list of Hebrew first and last names and counted the number of times a name appears as first and last on a private database of names. The result may be useful for someone extracting Hebrew names from the web.


New Year, New Look

Hi Everybody
Another look at our blog, made us think: Why do we still look so 90’s?
This is when we decided to do some cosmetic and functional changes:
We changed the theme (We though about buying a wordpress theme, but for some reason, they’re way too expensive),
We installed a new commend system called “Disqus”
We have a new logo,
And we generally want to make your stay more comfortable.
We hope you like it.
Roy and Arnon

Music Uncategorized

Trying out my mashup skills

This is not proper technical thingy, but I took some time to try out some audio skills by doing somewhat obvious mashup
Came out pretty good, in my opinion
Sara Baraeilles’s “Brave” and Katy Perry’s “Roar” sound very similar. So I took two acapellas and instrumental and mixed them together.
Enjoy (or.. not)
[soundcloud url=”″ params=”color=ff6600&auto_play=false&show_artwork=true” width=”100%” height=”166″ iframe=”true” /]


Speak friend and enter

Screen Shot 2013-12-21 at 12.58.00 PM


Trying out a new theme

Hi Guys,
After a while we are trying to “lighten” things up. Let us know what you think
Roy & Arnon


Tree nom



Changing our host

Hi Guys,
We are currently switching hosts which should lead to a faster website experience.
During this process, our emails might not be available for a while.
Have a great week
Arnon & Roy


Connecting a Samsung Vibrant and a pico projector

Wanted to report on some progress I made connecting the Samsung Galaxy S Vibrat smartphone and a 3M MPro110 pico (pocket) projector.
It is a fairly simple process, but I couldn’t really find any schematics of the video ports on either the phone (the 3.5mm headphones jack) or the projector (3.5mm composite video-in jack). So if anyone is trying to do this, they can find the wiring schematics here.


Congratulations Roy – Again!

I would (again) like to publicly congratulate my friend Roy, who got accepted for a PhD program in
Media Arts and Sciences, at the MIT Media Lab.
I am very happy the people at MIT was able to see your great talent.
I’m sure this program will get the best out of you, and that you will have very intense, interesting and exciting time


Congratulations! Roy is going to MIT

I would like to congratulate my friend Roy, who got accepted to M.I.T in the Program in Media Arts and Sciences.
Starting this September, Roy will be spending the next two years in Boston.
I wish him all the best and luck.
I’m sure this degree will provide some interesting posts to this blog