آخرین اخبار

از “جوشیدن سر سگ در دیگ برجام” تا منافع صدها میلیارد دلاری ملت ایران و شرکت های آمریکایی در مذاکرات رم طرح آمریکا برای پایان جنگ اوکراین؛ همه چیز به نفع مسکو فقط دیپلماسی راه‌حل بحران‌های ایران است / باید به نتیجه برد، برد دو طرف برسیم مذاکرات رم بسیار مهم است/ حرف‌های ضد و نقیضی از سوی مقام‌های آمریکایی مطرح شده که برخی از آن خواسته‌ها غیرواقعی و نشدنی است  «ترامپ خوب، نتانیاهوی بد»؛ بازی پلیس خوب و بد در مذاکرات هسته‌ای چارچوبی که می‌تواند ایران و آمریکا را به توافق برساند علی اکبر صالحی: زمان آن رسیده که ذهنیت جهان را نسبت به ایران با جدیت بیشتری تغییر دهیم جزئیات دور دوم گفت‌وگوهای ایران و آمریکا در ایتالیا/ عراقچی وارد رم شد تلاش ایران برای ارائه یک برنامه اقدام تدریجی، جهت لغو تحریم‌ها و عدم فعال‌سازی اسنپ‌بک در برابر بازگشت به محدودیت‌های هسته‌ای عراقچی در پایان سفر به مسکو: ملاقات با پوتین بیش از یک ساعت و نیم طول کشید

سپینو

3

دیتاست یک میلیون آگهی املاک «دیوار» متن‌باز منتشر شد

  • کد خبر : 1561
  • ۲۹ فروردین ۱۴۰۴ - ۱۸:۵۸
دیتاست یک میلیون آگهی املاک «دیوار» متن‌باز منتشر شد
پلتفرم «دیوار» دیتاست یک میلیون آگهی املاک منتشرشده در این پلتفرم را در Hugging Face به صورت متن‌باز و گمنام‌سازی‌شده منتشر کرد. این دیتاست نخستین مجموعهٔ ساختارمند در حوزهٔ املاک به زبان فارسی محسوب می‌شود.

به گزارش وفاق ملی، این اطلاعات بخشی از آگهی‌هایی را در بر می‌گیرد که در میانه سال ۱۴۰۳ فعال بوده و از میان شهرها و محله‌های مختلف، به‌صورت تصادفی انتخاب شده‌اند. دیوار در توضیح این اقدام خود می‌گوید: «این دیتاست نخستین مجموعه ساختارمند در حوزه املاک به زبان فارسی محسوب می‌شود و از نظر حجم، کیفیت و تمیز بودن داده‌ها، ابعاد قابل توجهی دارد.»

دیوار تأکید می‌کند که «برای حفظ حریم خصوصی کاربرانش، تمامی اطلاعات شخصی که ممکن بود به شناسایی افراد منجر شود، از این دیتاست حذف شده و صرفاً داده‌هایی که خود کاربر اجازه انتشار آن‌ها را داده بود، منتشر شده است.»

این داده‌ها می‌تواند پایه‌ای برای تیم‌های پژوهشی، محققان دانشگاهی و استارتاپ‌های فعال در حوزه پراپ‌تک (Property Tech) ایران باشد که در زمینه توسعه و ساخت مدل‌های هوشمند تخمین قیمت، طراحی سیستم‌های توصیه‌گر ملک، تحلیل متن و استخراج کلیدواژه‌ها و پژوهش‌های مرتبط با اقتصاد مسکن فعالیت می‌کنند. این حجم داده برای تقویت مدل زبانی فارسی نیز کاربرد دارد و می‌تواند در توسعه ابزارهای هوش مصنوعیِ فارسی مؤثر باشد.

برای استفاده از این مجموعه داده می‌توانید به وب‌سایت Hugging Face مراجعه کنید.

لینک کوتاه : https://vefaghemeli.com/?p=1561
انفرادی

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : 0
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.