موقع بوابة بلاد الشام ،belad-alsham
عزيزي آلزآئر
دعوة للانضمام قروب أهل الشام



 
الرئيسيةمجلة الشام آخبااليوميةس .و .جبحـثالمجموعاتالتسجيلدخولrss
قيّم موقع الشام من هنا

مساحة اعلانية br /> مساحة اعلانية
مساحة اعلانية
مساحة اعلانية

شاطر | 
 

 « وسائل الإعلام التنبيه: و... | الرئيسية | دعوة للمشاركة الآن ... »

اذهب الى الأسفل 
كاتب الموضوعرسالة
apache
اعضاء فعالين
اعضاء فعالين
avatar

عدد المشاركات : 123
نقاط : 227
التقيم : 20
تاريخ الميلاد : 15/03/1990
تاريخ التسجيل : 14/08/2012
العمر : 28

مُساهمةموضوع: « وسائل الإعلام التنبيه: و... | الرئيسية | دعوة للمشاركة الآن ... »   الأربعاء أغسطس 15, 2012 6:39 am


البرنامج أباتشي مؤسسة المدونة

« وسائل الإعلام التنبيه: و... | الرئيسية | دعوة للمشاركة الآن ... »
الثلاثاء 10 يوليو 2012
وبرامج مؤسسة أباتشي أباتشي يعلن Nutch ™ V2.0

المشاريع على نطاق بحث مفتوحة المصدر المستخدمة في إطار الزحف الشبكات الداخلية لفهرسة الويب العالمية.

فورست هيل، MD -10 يوليو 2012 - وبرامج مؤسسة أباتشي (ASF)، ومطوري كله من المتطوعين، الحكام، وحاضنات لنحو 150 مشاريع المصدر المفتوح والمبادرات، وأعلن اليوم أباتشي Nutch V2.0.

أباتشي Nutch هو إطار بحث تدرجية عالية مكتوب بلغة جافا. انها بنيت على مشاريع أباتشي عدة، بما في ذلك المؤسسة العامة ™، ™ تيكا، ™ Hadoop، و™ غورا، من بين أمور أخرى، عن الزحف، وقاعدة بيانات الارتباط الرسم البياني، وتقديم الدعم لتحليل HTML ومجموعة من الأشكال وثيقة أخرى.

"وقد كان في الأصل من النجوم المصدر المفتوح مثل Hadoop أباتشي أو تيكا أباتشي، Nutch أدرك الآن مع الاتجاهات NoSQL وتتبنى جدول أحب التمثيل"، وقال أباتشي Nutch نائب الرئيس جوليان Nioche.

وأشاد أباتشي Nutch لتطويره لها المرونة والتمدد، وهو خيار إشارة إلى للشركات من جميع الأحجام، من الشركات المبتدئة والشركات المتوسطة الحجم لمنظمات نطاق واسع.

قيد التطوير لمدة عامين تقريبا، Nutch V2.0 تغطي العديد من حالات الاستخدام، من صغير يزحف على جهاز واحد لتشغيل عمليات الانتشار على نطاق واسع على مجموعات Hadoop. "الأهم من ذلك، لا يزال Nutch سهلة لتخصيص بفضل الهندسة المعمارية المساعد له"، وأوضح Nioche. هندسته المعمارية وحدات عالية تسمح للمطورين لخلق المكونات الإضافية لتصنيف وثيقة، تحليل والفهرسة.

"نحن نستخدم Nutch 2.0 لتزحف على نطاق واسع على شبكة الإنترنت لأنها مرنة، بالاضافة الى الحفاظ على والمقاييس مع Hadoop. الزحف على الويب بطريقة قوية قابلة للتطوير والتهذيب قد تبدو سهلة من الناحية النظرية، ولكن في الممارسة العملية، انها ليست بهذه البساطة"، وقال Mathijs Homminga، منظمة السياحة القبرصية من Kalooga. "إن ويب هو البرية وترويض يتطلب المعرفة والخبرة على مستويات مختلفة ولهذا السبب اخترنا في البداية Nutch: تشغيله من خارج منطقة الجزاء، ويحتوي على نتائج الكثير والكثير، الكثير، الدروس المستفادة وقدم لنا رئيس. تبدأ الزحف Nutch لكن ليست مجرد أداة؛. Nutch هو إطار الزحف المرنة التي يمكننا تمديد وتعديل لاحتياجاتنا ".

Nutch V2.0 تتيح للمستخدمين طبعة تركز على نطاق واسع الزحف يعتمد على التجريد تخزين (عن طريق ™ غورا أباتشي) لمخازن البيانات الكبيرة مثل Accumulo أباتشي ™، ™ أباتشي أفرو، أباتشي ™ كاساندرا، أباتشي ™ HBase، HDFS أباتشي ™ (تصدر نشرة Hadoop نظام الملفات)، وتخزين البيانات في الذاكرة، والعديد من المتاجر البارزة SQL.

وقال "عملنا على 2.0 Nutch أنجبت غورا أباتشي في العملية، والذي تستخدمه كاستخراج على backends تخزين"، وأضاف Nioche. "هذه العمارة تعزيز يجعل Nutch ليس فقط أكثر كفاءة ولكن أيضا من الأسهل للتكامل مع أدوات خارجية في حين حل لا تزال طائفة واسعة من حالات الاستخدام التي تتراوح بين الاجهزة الخوادم واحد إلى الزواحف الإنترنت على نطاق واسع استضافتها في سحابة".

"2.0 منذ فترة طويلة جهد المجتمع وشيء كنا هانتانغ"، وقال كريس ألف Mattmann، نائب رئيس تيكا أباتشي وOODT أباتشي. "Nutch 2.0 'ق التكامل الوثيق مع تيكا، وهذا بدوره، سوف المصب التكامل تيكا حيز OODT أباتشي جلب مما لا شك فيه كل من مجتمعاتنا أقرب معا، وسوف تساعد في مواجهة التحديات البيانات الكبيرة التي هم في مشاريعنا نرى بانتظام. Nutch 2.0 يجعل كامل واستخدام أحدث الميزات من تيكا أباتشي، بما في ذلك تحليل وقدرات الكشف محتوى ".

وقال "حقيقة أن يتم تنفيذ Nutch على رأس Hadoop من الضروري بالنسبة لنا لأنه يسمح لنا بأن نكون في تحجيم التخزين والمعالجة - لقد سبق لك أن حاولت إعادة التوزيع 1 صفحات الويب مليار دولار في يوم واحد؟" وذكرت Homminga. "Kalooga يستخدم حاليا Nutch 2.0 في الإنتاج، مع الخلفية HBase، على كتلة Hadoop 34 عقدة. مجموعتنا الحالية تعقد حول صفحات الويب بليون، وتزايد بضع مئات من ملايين دولار شهريا. نقوم بتشغيل الفهارس على المؤسسة العامة وelasticsearch. Kalooga تقدم خدمة الصلة البصرية للناشرين على الإنترنت وNutch هو جزء أساسي من المكدس لدينا التكنولوجيا. "

"Nutch V2.0 هو مثير خصوصا أنه أدرك مع مشاريع أباتشي مثل HBase، كاساندرا، وAccumulo"، وأضاف Nioche. "لقد كانت استجابة المجتمع إلى الإصدارات السابقة من V2.0 مشجعة للغاية ونأمل أن نرى المزيد من الناس التورط".

توفر والرقابة
يتم تحريرها أباتشي Nutch البرنامج تحت رخصة V2.0 أباتشي، ويشرف عليها فريق الذاتي مختارة من المساهمين بشكل فعال في المشروع. مشروع لجنة الإدارة (PMC) يوجه المشروع يوما بعد يوم العمليات، بما في ذلك تنمية المجتمع المحلي والنشرات المنتج. موارد أباتشي شفرة المصدر Nutch، وثائق، والقوائم البريدية، وما يتصل بها من تتوفر في http://nutch.apache.org/~~V .

عن مؤسسة البرمجيات أباتشي (ASF)
أنشئت في عام 1999، ومؤسسة تشرف على كل من المتطوعين ما يقرب من 150 رائد مشاريع المصدر المفتوح، بما في ذلك خادم HTTP أباتشي - في العالم خادم الويب الأكثر شعبية البرمجيات. من خلال عملية ومحامون بلا حدود والجدارة والمعروفة باسم "الطريق أباتشي"، أكثر من 400 من الأعضاء الأفراد وCommitters 3500 التعاون بنجاح لتطوير متاحة بحرية المشاريع من الدرجة البرمجيات، ويستفيد منها الملايين من المستخدمين في جميع أنحاء العالم: يتم توزيع الآلاف من الحلول البرمجية تحت رخصة أباتشي، و المجتمع تشارك بنشاط في القوائم البريدية محامون بلا حدود، والتوجيه المبادرات، و. ApacheCon، مؤتمر للمؤسسة المستخدم الرسمية والدورات التدريبية، ومعرض ومحامون بلا حدود هو 501 الولايات المتحدة (3) (ج) لا تهدف للربح الخيرية، بتمويل من تبرعات الأفراد والشركات الراعية بما في ذلك AMD والتكنولوجيا أساس، سيتريكس، Cloudera، الفيسبوك، GoDaddy أو، جوجل، آي بي إم وهيوليت باكارد، Hortonworks، هواوي، مات mullenweg، ومايكروسوفت، PSW المجموعة، SpringSource، وياهو. لمزيد من المعلومات، زيارة http://www.apache.org/~~V .

"أباتشي"، "Nutch"، "أباتشي Nutch"، "Accumulo"، "أباتشي Accumulo"، "أفرو"، "أباتشي أفرو"، "كاساندرا"، "أباتشي كاساندرا"، "غورا"، "أباتشي غورا"، " Hadoop "،" أباتشي Hadoop "،" HBase "،" أباتشي HBase "،" HDFS "أباتشي HDFS"، "المؤسسة العامة"، "المؤسسة العامة أباتشي"، "تيكا"، "أباتشي تيكا"، و "ApacheCon" هي علامات تجارية ل مؤسسة البرمجيات أباتشي. جميع العلامات التجارية الأخرى والعلامات التجارية هي ملك لأصحابها.

# # #
نشر في يوليو 12:00 PM 10، 2012 بواسطة سالي في العام | التعليقات [1] |

تعليق:

لي أن أعيش هذه
السؤال من wwj في 16 يوليو عام 2012 في 6:32 صباحا بتوقيت جرينتش +00:00 #

أرسل تعليق:
التعليقات مغلقة لهذا الدخول.
الرجوع الى أعلى الصفحة اذهب الى الأسفل
معاينة صفحة البيانات الشخصي للعضو
apache
اعضاء فعالين
اعضاء فعالين
avatar

عدد المشاركات : 123
نقاط : 227
التقيم : 20
تاريخ الميلاد : 15/03/1990
تاريخ التسجيل : 14/08/2012
العمر : 28

مُساهمةموضوع: رد: « وسائل الإعلام التنبيه: و... | الرئيسية | دعوة للمشاركة الآن ... »   الأربعاء أغسطس 15, 2012 6:39 am


The Apache Software Foundation Blog

« MEDIA ALERT: The... | Main | Call For Papers Now... »
TUESDAY JUL 10, 2012
The Apache Software Foundation Announces Apache Nutch™ v2.0

Enterprise-scale Open Source search framework used for crawling intranets to global Web indexing.

Forest Hill, MD –10 July 2012– The Apache Software Foundation (ASF), the all-volunteer developers, stewards, and incubators of nearly 150 Open Source projects and initiatives, today announced Apache Nutch v2.0.

Apache Nutch is a highly scalable search framework written in Java. It is built on several Apache projects, including Solr™, Tika™, Hadoop™, and Gora™, among others, for crawling, a link-graph database, and parsing support for HTML and an array of other document formats.

"Having been at the origin of Open Source superstars such as Apache Hadoop or Apache Tika, Nutch now catches up with the NoSQL trends and adopts a table-like representation," said Apache Nutch Vice President Julien Nioche.

Apache Nutch is lauded for its flexible scalability and extensibility, and is the go-to choice for companies of all sizes, from start-ups and medium sized businesses to large scale organizations.

Under development for nearly two years, Nutch v2.0 covers many use cases, from small crawls on a single machine to running large scale deployments on Hadoop clusters. "Importantly, Nutch remains easy to customize thanks to its plugin architecture," explained Nioche. Its highly modular architecture allows developers to create plug-ins for document parsing, ranking and indexing.

"We use Nutch 2.0 for crawling at web scale because it is flexible, well maintained and scales with Hadoop. Crawling the Web in a robust, scalable and polite way may seem easy in theory. But in practice, it's not that simple," said Mathijs Homminga, CTO of Kalooga. "The Web is a wilderness and taming it requires knowledge and expertise on different levels. That's why we initially chose Nutch: it runs out of the box and contains the results of many, many, many, lessons-learned. It gave us a head start with crawling. But Nutch is not just a tool; Nutch is a flexible crawling framework which we can extend and modify to our needs."

Nutch v2.0 offers users an edition focused on large-scale crawling that builds on storage abstraction (via Apache Gora™) for big data stores such as Apache Accumulo™, Apache Avro™, Apache Cassandra™, Apache HBase™, Apache HDFS™ (Hadoop Distributed File System), an in-memory data store, and various high profile SQL stores.

"Our work on Nutch 2.0 gave birth to Apache Gora in the process, which it uses as an abstraction over the storage backends," added Nioche. "This enhanced architecture makes Nutch not only more efficient but also easier to integrate with external tools while still solving a large range of use cases ranging from single servers setups to large-scale Internet crawlers hosted in the cloud."

"2.0 has long been a community effort and something we've been eagerly anticipating," said Chris A. Mattmann, Vice President of Apache Tika and Apache OODT. "Nutch 2.0's close integration with Tika, and in turn, Tika's integration downstream into Apache OODT will undoubtedly bring all of our communities closer together, and will assist in the big data challenges that those in our projects regularly see. Nutch 2.0 makes full use of the latest features from Apache Tika, including its parsing and content detection capabilities."

"The fact that Nutch is implemented on top of Hadoop is essential for us since it allows us to be scalable in storage and processing --have you ever tried to reparse a billion web pages in a day?" stated Homminga. "Kalooga currently uses Nutch 2.0 in production, with the HBase backend, on a 34-node Hadoop cluster. Our current collection holds around a billion web pages, growing a few hundred million per month. We run indexes on Solr and elasticsearch. Kalooga offers a visual relevance service for online publishers and Nutch is an essential part of our technology stack."

"Nutch v2.0 is particularly exciting as it catches up with Apache projects like HBase, Cassandra, and Accumulo," added Nioche. "The community's response to the earlier versions of v2.0 has been very encouraging and we hope to see more and more people getting involved."

Availability and Oversight
Apache Nutch software is released under the Apache License v2.0, and is overseen by a self-selected team of active contributors to the project. A Project Management Committee (PMC) guides the Project’s day-to-day operations, including community development and product releases. Apache Nutch source code, documentation, mailing lists, and related resources are available at http://nutch.apache.org/.

About The Apache Software Foundation (ASF)
Established in 1999, the all-volunteer Foundation oversees nearly one hundred fifty leading Open Source projects, including Apache HTTP Server — the world's most popular Web server software. Through the ASF's meritocratic process known as "The Apache Way," more than 400 individual Members and 3,500 Committers successfully collaborate to develop freely available enterprise-grade software, benefiting millions of users worldwide: thousands of software solutions are distributed under the Apache License; and the community actively participates in ASF mailing lists, mentoring initiatives, and ApacheCon, the Foundation's official user conference, trainings, and expo. The ASF is a US 501(3)(c) not-for-profit charity, funded by individual donations and corporate sponsors including AMD, Basis Technology, Citrix, Cloudera, Facebook, GoDaddy, Google, IBM, HP, Hortonworks, Huawei, Matt Mullenweg, Microsoft, PSW Group, SpringSource, and Yahoo!. For more information, visit http://www.apache.org/.

"Apache", "Nutch", "Apache Nutch", "Accumulo", "Apache Accumulo", "Avro", "Apache Avro", "Cassandra", "Apache Cassandra", "Gora", "Apache Gora", "Hadoop", "Apache Hadoop", "HBase", "Apache HBase", "HDFS", Apache HDFS", "Solr", "Apache Solr", "Tika", "Apache Tika", and "ApacheCon" are trademarks of The Apache Software Foundation. All other brands and trademarks are the property of their respective owners.

# # #
Posted at 12:00PM Jul 10, 2012 by Sally in General | Comments[1] |

Comments:

Me live this
Posted by wwj on July 16, 2012 at 06:32 AM GMT+00:00 #

Post a Comment:
Comments are closed for this entry.

بلاد الشام ،~ تُوِقَيّعَ الَعَضّوِ ~بلاد الشام ،

بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام ،بلاد الشام

[center]
بسم الله مشاء الله جمال وبرائة اطفال اهل الشام

حسبنا الله ونعم الوكيل فيك يا بشار وكل من يشد على اياديك
[/center]
الرجوع الى أعلى الصفحة اذهب الى الأسفل
معاينة صفحة البيانات الشخصي للعضو
 
« وسائل الإعلام التنبيه: و... | الرئيسية | دعوة للمشاركة الآن ... »
الرجوع الى أعلى الصفحة 
صفحة 1 من اصل 1

صلاحيات هذا المنتدى:لاتستطيع الرد على المواضيع في هذا المنتدى
موقع بوابة بلاد الشام ،belad-alsham :: lkj]dhj fgh] hgahl :: منتديات الشام بلادي :: منتدي الربح من الإنترنت Make Money From The InterNet :: منتدى أباتشي google.com Apache ،Binding-
انتقل الى:  
دخول
اسم العضو:
كلمة السر:
ادخلني بشكل آلي عند زيارتي مرة اخرى: 
:: لقد نسيت كلمة السر
تبادل اعلاني

مساحة اعلانية
مواقع صديقة
Feedage.com RSS
Feedage Grade B rated
!-- Feedage.com RSS Feed Tracking
Preview on Feedage: %D9%85%D9%88%D9%82%D8%B9-%D8%A7%D9%87%D9%84-%D8%A7%D9%84%D8%B4%D8%A7%D9%85- Add to My Yahoo! Add to Google! Add to AOL! Add to MSN
Subscribe in NewsGator Online Add to Netvibes Subscribe in Pakeflakes Subscribe in Bloglines Add to Alesti RSS Reader
Add to Feedage.com Groups Add to Windows Live iPing-it Add to Feedage RSS Alerts Add To Fwicki
Meta Tag Analyzer

Meta Tag Analyzer

عدد زوار بلاد الشام
Free counter and web stats
المواضيع الأخيرة
» تحميل برنامج البروكسي
الأحد أكتوبر 12, 2014 7:13 am من طرف heba fathy

» سوريا المحتلة العرب
الأحد أكتوبر 28, 2012 3:32 am من طرف يعقوب محمد

» الطفولة تتفض.. ( من اطفال العراق الى اطفال سوريا المحتلة ) .. جراحاتكم نعيشها
الأربعاء أكتوبر 10, 2012 4:23 am من طرف يعقوب محمد

» من الذي اساءة للنبي الكريم ياقتلة الشعب السوري ؟؟؟
الجمعة سبتمبر 21, 2012 4:36 am من طرف يعقوب محمد

» ModemMAX , برنامج ModemMax , تسريع الانترنت , برامج تسريع الاتصال , زيادة سرعة الاتصال , سرعة الاتصال , تحميل برنامج ModemMAX , برنامج ModemMAX الجديد , برنامج ModemMAX كامل مجانا , download ModemMAX
الثلاثاء سبتمبر 18, 2012 3:31 pm من طرف rakan-jordan

» S.S.N-تصريحات هامة للعقيد عبدالجبار العكيدي 25-8.mp4
الثلاثاء سبتمبر 18, 2012 3:27 pm من طرف rakan-jordan

» الرباعية تسعى لمنظور مشترك حول سوريا المحتلة
الثلاثاء سبتمبر 18, 2012 3:26 pm من طرف rakan-jordan

» استشهاد 142 شخص مقتل 40 عنصر من “جيش الاسادي” في سوريا المحتلة
الثلاثاء سبتمبر 18, 2012 3:25 pm من طرف rakan-jordan

» نورا الجيزاوي حرة: سمعت بدموع الفرح واليوم تذوقت لذتها on 2012/09/18 09:57 / لا يوجد اي تعليق منذ نعومة أظفاري و أنا بسمع “بدموع الفرح” بس لليوم لحتى تذوقت لذتهم ♥ الله لا يحرم حدا هالشعور يااااا
الثلاثاء سبتمبر 18, 2012 3:24 pm من طرف rakan-jordan

سحابة الكلمات الدلالية
غليص الاول الجزء الريف اللبناني الرحيل