كيف تكشف مؤامرة الفقاعة أفضل المدن للعيش في الولايات المتحدة

في هذا المقال ، سأريك بعض الحقائق المثيرة عن المدن الأمريكية ، وقيمة مخططات الفقاعات عند تحديد المدينة التي ستعيش فيها ، وكيفية إنشاء تلك المؤامرات.

هل تفكر في الاستثمار في العقارات في عام 2018؟ هل تغادرالى مدينة جديدة؟ عند النظر في هذه القرارات ، تحتاج إلى تقييم عوامل مختلفة مثل معدل البطالة وسعر السكن وحجم المدينة والسلامة وما إلى ذلك. حتى مع وجود كل هذه البيانات وأربعة مخططات شريطية متوافقة ، فستظل تجهل في ذلك الجدول. ستحاول العثور على أفضل المرشحين ، ولكن هذه العوامل تحكي قصصًا مختلفة ... تبدو وكأنها مشكلة معقدة.

لذلك ، هل هناك طريقة يمكننا تصور كل هذه العوامل في مخطط واحد ومقارنتها جميعًا؟ نعم ، يمكننا استخدام مؤامرة فقاعة!

ما هي مؤامرة الفقاعة؟

مؤامرة الفقاعة عبارة عن نوع من المخططات يعرض أكثر من بعدين للبيانات (مقارنة بمخططات الانتثار التقليدية). بالإضافة إلى رسم نقطة على مستوى X-Y ، فإنه يستخدم حجم النقطة أو لونها أو شكلها لعرض المزيد من الأبعاد.

نحن نستخدم معدل البطالة كمحور X ، وسعر المنزل المتوسط ​​كمحور Y ، وسكان المدن بحجم النقاط. وهذا يجعل البعد الثالث جيد. يتم تعيين اللون عشوائيا لكل مدينة.

أفضل مدينة في الولايات المتحدة للعيش فيها هي ... (انتظرها)

الفائز: ناشفيل!

توصيات أخرى: أوستن ، أوماها ، ميلووكي ، دالاس ، مينيابوليس ، دنفر وأورورا.

لديهم بطالة منخفضة (وبالتالي هناك فرصة أكبر للعثور على وظيفة) ، وانخفاض سعر المنزل ، لأنهم في الجانب الأيسر السفلي من المؤامرة. ماذا يعني ذلك؟

هذا يعني أنه يمكنك اتخاذ اختياراتك على أساس هذه المؤامرة.

على سبيل المثال ، إذا كنت تعتقد أن معدل البطالة أكثر أهمية ولا تمانع في ارتفاع أسعار المنازل ، فإن هونولولو وأوكلاند وبوسطن وسان دييغو من المرشحين الأقوياء

ماذا عن إضافة السلامة كعامل آخر؟

بالتأكيد. دعنا نضيف الأمان كعامل رابع (العوامل الثلاثة الأخرى هي أسعار المنازل ، ومعدل البطالة ، والسكان). بدلاً من تعيين لون عشوائي للمدينة ، نستخدم مقياس الألوان للجريمة (معدل الجريمة لكل 100000 شخص). الأحمر يعني المزيد من الجريمة والأزرق يعني أقل.

هل تتغير النتيجة؟

فعلت! إذا كانت السلامة مهمة للغاية بالنسبة لك ، فقد لا يكون ميلووكي خيارًا رائعًا من بين التوصيات السابقة (على الرغم من أنها في الجانب الأيسر السفلي من الرسم البياني).

الآن ترى قوة مؤامرة الفقاعة: القدرة على إظهار عوامل متعددة في مؤامرة ثنائية الأبعاد. إذا كان لديك مخططات شريطية لتلك العوامل ، فمن الصعب عليك تحديد المدن بمزيج مثالي من العوامل. خلقت مؤامرة الفقاعة أساسًا "وظيفة موضوعية مرئية" من أجلك لتحسين مشكلة صنع القرار متعدد المتغيرات.

كيف يتغير معدل البطالة وأسعار المنازل مع مرور الوقت؟

يمكننا إنشاء مخطط حركة تفاعلي لإضافة الوقت كبعد (2013 إلى 2017) لنرى كيف تتغير العوامل لهذه المدن مع مرور الوقت.

لتجنب الكثير من المعلومات المرئية ، لم أستخدم بيانات الجريمة واستخدمت الألوان المختلفة لتمثيل بعض المدن المحددة.

والخبر السار هو أن معدل البطالة في جميع المدن تقريبًا انخفض بشكل كبير (الانتقال من اليمين إلى اليسار). لكن الأخبار السيئة هي أن أسعار المساكن ترتفع بسرعة كبيرة (خاصة بالنسبة لسان فرانسيسكو وسان خوسيه ولوس أنجليس ونيويورك وسياتل).

تريد إنشاء المخططات بنفسك؟ إليك الكود الخاص بمخططات الفقاعة والمخطط الحركي في R. استمتع باللعب مع المؤامرات :)

###############
# مؤامرة الفقاعة #
###############
مكتبة (data.table)
مكتبة (ggplot2)
مكتبة (ggrepel)
bubble_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_city_dity.csv"، sep = "،")
bubble_plot <- ggplot (bubble_data ،
               aes (x = Unemployment_Rate ، y = Home_Price / 1000)) +
geom_point (aes (الحجم = السكان ، التعبئة = Total_Crime) ، الشكل = 21) +
# إنشاء "فقاعة" عن طريق تعيين حجم متغير #
scale_fill_continuous (low = "# 33FFFF"، high = "# FF6699") +
scale_size_area (max_size = 20) +
# حدد مقياس لون الفقاعة وحجم الفقاعة الأقصى #
geom_text_repel (
          aes (label = City) ، nudge_x = 0 ، nudge_y = 0.75 ، الحجم = 6) +
# استخدم geom_text_repel لصد الملصقات بعيدًا عن بعضها البعض #
theme_bw () +
# استخدم خلفية بيضاء بدلاً من اللون الرمادي الافتراضي #
ggtitle ("أفضل المدن في الولايات المتحدة للعيش فيها") + labs (x = "معدل البطالة٪" ، y = "سعر المنزل" ،
       size = "السكان" ، fill = "Crime") + السمة (plot.title = element_text (size = 25 ، hjust = 0.5) ،
        axis.title = element_text (size = 20، face = "bold") ،
        axis.text = element_text (size = 15)) +
# عنوان النمط والمحور #
scale_y_continuous (name = "Home Price" ، فواصل = seq (0 ، 1500 ، = 250) ،
                      التصنيفات = c ("0" ، "250K" ، "500K" ، "750K" ، "1000K" ، "1250k" ، "1500K"))
# اجعل المحور ص أكثر قابلية للقراءة من خلال استبدال الرقم العلمي بـ "K" #
طباعة (bubble_plot)
################
# مخطط الحركة #
################
مكتبة (data.table)
مكتبة (googleVis)
motion_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/motion_chart_merged_city_dity.csv"، sep = "،")
motion_chart <- gvisMotionChart (motion_data ،
idvar = "المدينة" ،
timevar = "السنة" ،
xvar = "معدل البطالة" ،
yvar = "سعر المنزل" ،
sizevar = "السكان")
مؤامرة (motion_chart)
# R يفتح تلقائيا علامة تبويب في المتصفح لك
# يحتاج مشغل الفلاش إلى التمكين في المتصفح
انقر فوق الرمز
########
# البيانات #
########
"" "
مجموعات البيانات التي استخدمتها مأخوذة من Zillow (سكن متوسط) وبرنامج FBI UCR ، census.gov (السكان) ، مكتب العمل (البطالة).
قمت ببعض عمليات تنظيف البيانات والانضمام إليها بالتنسيق الذي أحتاجه في هذه المقالة ، ويمكنك النقر فوق الروابط أدناه للتنزيل.
"" "
bubble_plot_merged_city_data.csv، motion_chart_merged_city_data.csv

اتبعني وأعطيني بعض التصفيق إذا وجدت هذا مفيدًا!

يمكنك أيضًا قراءة مقالاتي السابقة حول علوم البيانات والعقارات وصنع القرار: