یکشنبه ۰۲ مهر ۰۲ ۰۸:۴۶ ۵ بازديد
پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده NLP پردازش زبان های طبیعی · • • • • °°• پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده پردازش زبان های طبیعی پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده پردازش زبان های طبیعی پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده › پروژهنگاشتاسامیپروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده › پروژهنگاشتاسامی پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده پردازش زبان های طبیعی در این پروژه جهت یافتن اسم ها، از یک دیتابیس اختصاصی استفاده می کند، این دیتابیس از نوع می باشد که نیاز است کنار فایل اصلی پروژه وجود پردازش زبان طبیعی با پایتون — راهنمای جامع – فرادرس مجله › پردازش زبان طبیعی با پایتون — راهنمای جامع – فرادرس مجله › مقدمه انگیزه سرآغاز اسکراپ کردن مقالات خبری برای بازیابی داده استخراج متون و پیشپردازش حذف کردن تگهای حذف کاراکترهای آکسان دار حالت گسترده اختصارات حذف کاراکترهای ویژه ریشهیابی لغوی دادههای ساختنیافته و به طور خاص متن، تصاویر و ویدیوها حاوی حجم بالایی از اطلاعات هستند با این حال به دلیل پیچیدگی ذاتی پردازش و تجزیه و تحلیل این دادهها، افراد غالباً از صرف زمان و تلاش زیاد روی مجموعه دادههای ساختنیافته که در حکم کاوش معدن طلا هستند اجتناب میکنند پردازش زبان طبیعی به بهرهگیری از ابزارها، تکنیکها و الگوریتمها برای در نهایت، حوزهای تخصصی در علوم رایانه و هوش مصنوعی محسوب میشود که ریشه در زبانشناسی محاسباتی دارد دغدغه اصلی این حوزه از علوم، طراحی و ساخت برنامه و سیستمهایی است که امکان تعامل بین ماشینها و زبانهای طبیعی را فراهم سازند و در طی زمان برای استفاده انسان تکامل پیدا کنند از این رو در اغلب موارد این حوزه علمی به عنوان یک زمینه کمعمق و سطحی زمانی که مشغول ساخت محتوا و مثالهای این آموزش بودیم بین دو راه برای انتخاب مجموعه داده ساختگی برای بررسی بهتر مسائل و یا تمرکز روی مجموعه دادههای موجود از یکی از منابع برای علوم داده دچار شک و تردید بودیم در نهایت تصمیم گرفتیم به اسکراپ کردن وب و گردآوری برخی متون جهت ایجاد مثالهای کاربردی بر اساس آن بپردازیم دادههای منبع که روی آنها کار خوا ما به اسکراپ کردن وب سایت از طریق بهرهگیری از پایتون برای بازیابی مقالات خبری خواهیم پرداخت در این بخش روی مقالاتی در حوزههای فناوری، ورزش و اخبار جهانی متمرکز شدهایم از هر دسته مقالاتی به اندازه یک صفحه انتخاب میکنیم یک صفحه فرود دسته خبری معمولی در تصویر زیر نمایش یافته است که بخشهای برای محتوای متنی هر مقاله معمولاً چند مرحله در زمینه پاکسازی و پیشپردازش دادههای متنی وجود دارد مراحل پیشپردازش متن به تفصیل در این لینک ارائه شده است با این حال در این بخش نیز برخی از مهمترین گامهایی که به طور مکرر در پردازش زبان طبیعی مورد استفاده قرار میگیرند را بررسی کردهایم این گامها به وفور در پروژههای مورد بهرهبرداری قرار میگیرند ما اندکی از متنهای ساختنیافته غالباً شامل مقدار زیادی نویز هستند، به خصوص اگر از تکنیکهایی مانند اسکراپ کردن وب یا صفحه استفاده کنید تگهای به طور معمول یکی از مؤلفههایی هستند که ارزش زیادی در جهت درک و آنالیز متن اضافه نمیکنند از روی خروجی فوق کاملاً مشخص است که میتوانیم تگهای غیر ضروری را حذف و اطلاعات متنی مفید را در همه اسناد حفظ کنیم معمولاً در همه اسناد متنی با کاراکترهاحروف آکسان دار مواجه میشویم به خصوص اگر بخواهید زبان انگلیسی را آنالیز کنید از این رو باید مطمئن شویم که این کاراکترها به صورت کاراکترهای تبدیل و استاندارد شدهاند یک نمونه ساده تبدیل é به است تابع قبلی به ما نشان میدهد که چگونه میتوانیم به راحتی کاراکترهای آکسان دار را به کاراکترهای نرمال انگلیس اختصارها نسخه خلاصهشدهای از کلمات یا هجاها هستند آنها معمولاً به شکلهای مکتوب یا شفاهی در زبان انگلیسی وجود دارند نسخههای خلاصه شده یا اختصاری کلمات با حذف برخی حروف و صداهای خاص تولید میشوند در مورد اختصارات انگلیسی در اغلب موارد از طریق حذف یک یا چند مصوت از کلمه پدید میآیند نمونههایی از اختصارات به صورت تبدیل به ’ و تبدیل کاراکترهای ویژه و نمادها معمولاً کاراکترهای عددیحرفی یا حتی در مواردی کاراکترهای عددی بسته به مسئله هستند که باعث افزایش نویز در متون ساختنیافته میشوند به طور معمول میتوان از عبارتهای قاعدهمند ها برای حذف آنها استفاده کرد حذف ارقام به صورت اختیاری است، زیرا در اغلب موارد ممکن است در مرحله پیشپردازش متن نیاز به حفظ آنها وجود داش برای درک میبایست درکی از ریشه کلمه داشته باشید ریشههای کلمات که به نام حالت پایه واژه نیز شناخته میشوند مواردی هستند که پسوندهای مختلف در فرایندی به نام تصریف به آن میچسبند و واژههای جدیدی میسازند برای مثال واژه را در نظر بگیرید میتوان به آن پسوندهایی اضافه کرد و کلمات جدیدی مانند ، ، و از آن ساخت در این ‘’ نگاشت اسامی داخل متن به پایگاه دادهی افراد شناخته شده › › نگاشت اسامی داخل متن به پایگاه دادهی افراد شناخته شده › › نگاشت اسامی داخل متن به پایگاه دادهی افراد شناخته شده تا الان برای این درخواست پیشنهاد توسط فریلنسرهای سایت ارسال شده است پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده › پروژهپروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده › پروژه نرم افزار جهت نگاشت اسامی داخل متن به افراد شناخته شده، در محیط ویژوال استودیو ۲۰۱۳ با ایجاد گردید روش کار نرم افزار پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده › › پروژهنگاشتپروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده › › پروژهنگاشت · فایز لینک، مقاله و تحقیقات دانش آموزی و دانشجویی پارسی پروژه پارسی پروژه پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده پردازش زبان های طبیعی قیمت ریال پروژه ثبت نام مدرسه با داکیومنت
در این پروژه جهت یافتن اسم ها، از یک دیتابیس اختصاصی استفاده می کند، این دیتابیس از نوع XML می باشد که نیاز است کنار فایل اصلی پروژه وجود داشته باشد. جهت به دست آوردن دیتابیسی جامع از اسم های افراد معروف، لیست بازیگران، ورزشکاران، سیاستمداران، روحانیون، دانشمندان، هنرمندان، نقاشان، نویسندگان و… از ویکی پدیا جستجو شد و در یک فایل Excel اضافه شد، سپس با استفاده از توابع Excel نام و نام خانوادگی افراد از هم جدا شد. سپس دیتاهای ; تکراری حذف شد. بعد از کانورت اطلاعات به صورت مناسب و در قالب فایل XML ;دیتابیس آماده است. نرم افزار NLP_Project جهت نگاشت اسامی داخل متن به افراد شناخته شده، در محیط ویژوال استودیو ۲۰۱۳ با .net 4.5 ایجاد گردید. ; روش کار نرم افزار: متن مورد نظر را در کادر بالا وارد کرده ; و دکمه “جستجو با Wikipedia API ” را کلیک می کنیم، برنامه همه کلمه های جمله را بررسی کرده و با نام های دیتابیس XML ;مقایسه می کند، در صورتی که کلمه مورد نظر در فایل XML وجود داشته باشد، برنامه به وب سرویس Wikipedia API متصل شده و نتایج مربوطه به کلمه را است ...
پروژه نگاشت اسامی داخل متن به پایگاه داده افراد شناخته شده NLP پردازش زبان های طبیعی
دریافت فایل
دسته بندی : برنامه نویسی ، سورس ، پروژه
تگ : پردازش زبان طبیعی , NLP , پردازش متن
دسته بندی : برنامه نویسی ، سورس ، پروژه
تگ : پردازش زبان طبیعی , NLP , پردازش متن
اسامی قابل شمارش و غیر قابل شمارش از اجزای مهم زبانها هستند که در تشکیل جملات و انتقال مفاهیم زبانی نقش مهمی ایفا میکنند. اسامی قابل شمارش افراد، اشیاء یا مفاهیمی هستند که میتوان آنها را شمارش کرد و به صورت مفرد یا جمع در جمله ظاهر میشوند. به عنوان مثال، "کتاب"، "دانشجو" و "خانه" از اسامی قابل شمارش هستند.
از سوی دیگر، اسامی غیر قابل شمارش اشیاء یا مفاهیمی هستند که نمیتوان آنها را به صورت مفرد شمارش کرد و تنها به صورت کلی یا جمعیتی در جمله ظاهر میشوند. به عنوان مثال، "آب"، "عشق" و "پول" از اسامی غیر قابل شمارش محسوب میشوند.
استفاده صحیح از این دو نوع اسم در نوشتار یا گفتار زبانی، به درستی و روانی جملات را تضمین میکند و به افراد کمک میکند تا اطلاعات خود را با دقت و وضوح منتقل کنند.