تعتبر أنماط أداة شائعة الاستخدام في تحليل البيانات المالية، يستخدم المحللون أنماط الرسم البياني كمؤشرات للتنبؤ بحركات الأسعار المستقبلية، ومع ذلك، فإن الأنماط وتفسيراتها ذاتية وقد تؤدي إلى استنتاج غير متسق وتفسير متحيز.
في هذه المقالة، استخدمنا استراتيجية تعتمد على البيانات استنادًا إلى طرق موضوعية للتعلم الآلي لتحديد الأنماط المميزة التي تميز البيانات بشكل أفضل وتمكين فحص القدرة التنبؤية للأنماط، على وجه التحديد، استخدمت طرقًا متنوعة للتعلم الآلي غير الخاضعة للإشراف لتجميع بيانات السلاسل الزمنية في فئات قابلة للفصل، تتفق جميع الطرق بالإجماع على أن الدوال التوافقية البسيطة هي الأفضل لتوصيف البيانات، أجد أيضًا أن إجراء مزيد من التصفية للبيانات حسب الوقت أو القطاع أو الربحية لا يضيف قوة تنبؤية إلى المجموعات.
لا تزال هناك حاجة لمزيد من الاستكشاف للبيانات، في المستقبل، نود دراسة الطبيعة متعددة المقاييس للمشكلة وكذلك توسيع الدراسة لتشمل المزيد من المجموعات في التحليل غير الخاضع للإشراف.
شكل 1: السلاسل الزمنية المضمنة في بعدين – النتائج تصور كمجموعات
يهدف التحليل الفني في التداول إلى تقييم الاستثمارات وتحديد الفرص باستخدام بيانات السعر والفوليوم فقط، قد يكون لهذا النوع من التحليل في التداول قيمة تنبؤية، خاصة عند مقارنته بالتحليل الأساسي، يبحث التحليل الأساسي في التقارير المالية للشركة، وحالة الاقتصاد، واتجاهات الصناعة لتحديد ما إذا كانت القيمة “الحقيقية” أو المقدرة للسهم تعكس قيمتها المتداولة الحالية، إذا كان السعر الحالي أقل من السعر المقدر الذي نتوقعه، فسوف يرتفع سعر السهم، والعكس صحيح إذا كان السعر المقدّر أقل من السعر الحالي، من ناحية أخرى، في التحليل الفني وجهة نظر، يتم وضع جميع الأساسيات المعروفة لنشاط الشركة في الاعتبار بشكل فوري في سعر السهم، وبالتالي، ليست هناك حاجة لاستكشاف الظروف الاقتصادية للشركة – فقد انعكس ذلك بالفعل في السعر، الثمن هو كل ما يهم!
بالنسبة للمحلل الفني، يتم إجراء التنبؤات من خلال تحديد الأنماط “المعروفة” بأنها تؤدي إلى نتيجة محددة مسبقًا، بعض أنماط الرسوم البيانية المعروفة هي الرأس والكتفين، والمثلث، والقمة المزدوجة، وما إلى ذلك، هذه أشكال عامة يمكن أن تتخذها أسعار الأسهم، وقد وجد المحللون الفنيون أن هذه الأشكال مفيدة في عمل تنبؤات في التداول، على سبيل المثال، يعتبر الرأس والكتفين علامة انعكاس، تشير إلى اتجاه صاعد إلى اتجاه هابط، ومع ذلك، يوجد تعقيد للمحلل الفني في عمل التنبؤات ذات الصلة بسبب عادة، هناك علامات متعددة في سلسلة زمنية معينة، على سبيل المثال، قد يكون النمط 70٪ رأس وكتفين، و 20٪ قناة للأعلى.
ومن ثم يمكن الاعتماد على الأنماط المعروفة في التحليل الفني، ومع ذلك، تدعم مجموعة من الأبحاث فكرة أن الاستفادة من أنماط الرسوم البيانية في التحليل الفني لها قيمة تنبؤية مفيدة، على سبيل المثال، بالنسبة لنمط الرسم البياني للعلم الصاعد، درست ورقتين منفصلتين طرق مطابقة الأنماط وحدد الكمية مدى تطابق مخطط سهم معين مع نمط مخطط العلم الصاعد، حددت أولى هذه الأوراق قواعد التداول بناءً على مدى توافق مخطط الأسهم مع العلم الصاعد ووجدت أن قواعد التداول هذه فعالة في الأمثلة خارج العينة (Leigh، William، وآخرون.
الشكل 2: مثال على نموذج العلم الصاعد
الثانية تركز على مؤشرين في سوق الأوراق المالية – مؤشر ناسداك المركب (NASDAQ)و ال مؤشر تايوان الوزني (TWI)، وجدت الدراسة الثانية أن قواعد التداول الفنية تتنبأ بشكل صحيح باتجاه تغييرات السوق، ووجدت أيضًا أن التطابقات مع نموذج العلم الصاعد كان مرتبطًا بالعائدات الأعلى (Wang و Jar-Long و Shu-Hui Chan.
عند النظر في نموذج الرسم البياني للعلم الصاعد وحده، وجدت هاتان الورقتان البحثيتان المنفصلتين أنه يمكن للمتداول تحقيق ربح، في المتوسط، من خلال الاستفادة من أنماط الرسم البياني.
ومع ذلك، يبقى أن معظم الأبحاث حول أنماط الرسم البياني للتحليل الفني عناوين إما تقييم فائدتها في التداول أو تطبيق التقنيات الجديدة للتعرف على أنماط الرسوم البيانية.
يعكس هذا المشروع بحثي بدلاً من التركيز على أنماط الرسم البياني الحالية، ركزت على تحديد ما إذا كان بإمكاني استخراج بعض المعنى من أي أنماط ناتجة، كنت مهتمًا بالبحث عن الأسئلة التالية:
● هل يمكننا تحديد الأنماط في السلاسل الزمنية للأسهم باستخدام التعلم الموجه؟
● هل سنجد أنماطًا مشابهة لـ أنماط المخططات؟
● هل سنجد أنماطًا تُعد مؤشرات جيدة للربح / الخسارة المحتملة؟
لقد استخدمت نهجًا يعتمد على البيانات لملاحظة ما إذا كانت هذه الأنماط موجودة بالفعل في البيانات، على وجه التحديد، لقد استخدمت Yahoo المالية بيانات الأسهم اليومية للشركات التي تساهم في مؤشر S&P 500 (على سبيل المثال، JPM، Google، Amazon،إلخ.)، لكن محدود البيانات لآخر 30 سنة (1990-2020).
امتدت البيانات لما يقرب من 30 عامًا لكل شركة، كنت أرغب في تحديد أنماط في فترات زمنية قصيرة ومتسلسلة، بعد بعض الاكتشافات، اخترت 50 يومًا بطول أجزاء السلاسل الزمنية، كان قلقي الرئيسي فيما يتعلق بطول السلسلة الزمنية هو الصعوبة المحتملة في العثور على أنماط ذات معنى إذا كانت المقاطع قصيرة جدًا، في حين أن 50 يومًا من التداول ليست طويلة جدًا، كنت أتوقع أن تكون هذه المدة مواتية للحصول على كل من القيمة التنبؤية والأنماط المميزة، لا تزال تبحث إلى الأمام، سيكون من المثير للاهتمام القيام باستكشاف أعمق وتحديد الأنماط التي قد تظهر على نطاق زمني أطول أو متغير.
من أجل أنماط متسقة في أجزاء السلاسل الزمنية، كنت بحاجة إلى جمع العديد من هذه المقاطع، لقد استخدمت طريقة bootstrap وأخذت عينات عشوائية (مع الاستبدال) 50,000 قطعة من 50 يومًا من البيانات، بعد أخذ العينات، استخدمت إحدى طرق التجميع العديدة: K-Means أو DBSCAN أو Hierarchical Clustering أو K-Means على سلسلة زمنية مشفرة تلقائيًا لفصل المقاطع إلى أنماط يمكن تمييزها.
كان الهدف من المشروع فحص الخصائص التي تميز المجموعات، على وجه الخصوص، كنت أبحث عن مراكز المجموعات التي بدت مشابهة لأنماط المخططات الحالية، بالإضافة إلى المجموعات التي لديها ربح / خسارة محتمل في المستقبل أعلى في المتوسط من المجموعات الأخرى.
في هذا القسم، أعرض نتيجة التجميع باستخدام طرق وقطاعات مختلفة أطوال، بالإضافة إلى ذلك، اكتشف خصائص المقاطع الناتجة.
في الشكل 3، أصور نتيجة فصل المقاطع باستخدام خوارزمية K-Means، في هذا الشكل، تمثل كل نقطة مقطعًا مدته 50 يومًا تم تضمينه داخل مساحة ثنائية الأبعاد باستخدام تضمين t-SNE، الهدف هنا هو التأكد من الناحية الكمية من أن المجموعات مفصولة جيدًا، استكشف إذا كان يمكن تمييز أي من المجموعات على أنها تمثل الربحية.
لقد اختبرت منحنى التعلم لمجموع المربعات داخل المجموعة كدالة لعدد المجموعات لمجموعة من الأرقام (حتى 20)، ثم اخترت استخدام أربع مجموعات باستخدام طريقة الكوع، من الضروري استكشاف عدد أكبر من المجموعات، لأن هذا يزيد من فرصة تعلم أنماط أكثر تعقيدًا – خاصة الأنماط المستخدمة في الممارسة.
في الشكل 3، كل مجموعة مختلفة خريطة ملونة، المقياس يتوافق مع نسبة الربح المحتمل إلى الخسارة المحتملة، أي أنه كلما كان اللون أغمق، كانت السلاسل الزمنية أكثر ربحية، نحدد الربح المحتمل على أنه مقدار الربح الذي يتم تحقيقه من خلال استثمار 100 دولار في نهاية السلسلة الزمنية والبيع بأقصى سعر خلال 20 يومًا، يُعرّف المقابل، الخسارة المحتملة، على أنه المبلغ المفقود عند استثمار 100 دولار والبيع عند أدنى نقطة في 20 يومًا.
للأسف، لا نرى أي مجموعات تظهر على أنها مربحة أو غير مربحة بشكل خاص، لذلك، نواصل التحقيق في معنى كل مجموعة بالضبط.
الشكل 3: نتائج الكتلة لـ K-Means، حيث يتم تحديد التدرج من خلال نسبة الربح المحتمل إلى الخسارة المحتملة
الشكل 4: المخططات البار للمجموعات حسب الأسبوع والشهر والسنة
بعد التحقق مما إذا كانت المجموعات مرتبطة بالربح أم لا، نتحقق مما إذا كانت المجموعات مرتبطة بالتاريخ، على وجه التحديد، السنة والشهر والأسبوع من الشهر، ومع ذلك، كما يوضح الشكل 4، نرى ملفات تعريف متشابهة طوال الوقت، لا يبدو أن مجموعتنا يتم تجميعها حسب الوقت أو الربح.
الشكل 5: مخططات البار للمجموعات حسب القطاع
يستكشف الشكل 5 العلاقة بين المجموعات المختلفة والقطاعات المختلفة، كما هو الحال في الأشكال 3-4، من الناحية النوعية، لا يمكننا العثور على أي فرق يمكن تمييزه بين القطاعات المختلفة في الشكل 5، وبما أن التجميع لا يكشف عن أي ارتباط واضح مع أي من البيانات الوصفية الخاصة بنا، فإننا نفترض أن التجميع يرتبط بالأنماط الموجودة في البيانات.
ما هو النمط بالضبط، وكيف يبدو؟ ويظهر في الشكل 6 أمثلة على الأنماط المستخدمة في التحليل الفني، لاحظ أن هذه الأنماط ليست فريدة وأن الاختلافات الصغيرة لا تزال تعتبر نفس النمط، والأهم من ذلك، أن هذه الأنماط تظهر سلوكًا متذبذبًا كما يتضح من الشكل 6 ب.
الشكل 6 أ: مثال على نمط الرأس والكتفين
الشكل 7: متوسط السلاسل الزمنية لكل مجموعة.
في اللوحة اليمنى، يتم قياس عرض الخط حسب تعداد الكتلة، في اللوحة اليمنى، يتم قياس عرض الخط حسب متوسط الربح المحتمل للمجموعة.
كما هو موضح في الشكل 7، تشبه الموجات أحادية اللون موجات ذات الترددات المختلفة، لاحظ أنه في الرسم الأيسر للشكل 7، يتم ترجيح عرض الخط حسب تعداد الكتلة، بينما في المخطط الأيمن، يتم ترجيح عرض الخط حسب متوسط الربح المحتمل للمجموعة، من هذه المخططات، يمكننا أن نرى أن جميع المجموعات الأربع لها تعداد سكاني متشابه وأن هناك اختلافًا طفيفًا جدًا في متوسط الربح المحتمل لكل مجموعة.
الشكل 8: متوسط السلاسل الزمنية للمجموعات باستخدام أربع طرق تجميع مختلفة.
لتجنب فرط احتواء طريقة التجميع، نجرب عدة طرق بديلة، من خلال استكشاف طرق التجميع المختلفة، نتجنب الخوارزميات التي ترتكب نفس الأخطاء وتزيد من ملاءمتها لاستراتيجية معينة، الآن، إذا عادت طرق التجميع إلى نتائج مماثلة، فإنها تدعم الحجة القائلة بأن هذه الأنماط تميز البيانات بالفعل.
كما يتضح من الشكل 8، تعيد K-Means و DBSCAN و Hierarchical Clustering أنماطًا متشابهة جدًا، تختلف طريقة التشفير التلقائي قليلاً، ومع ذلك، لا تزال أنماطها تظهر متناسقة وتحتفظ بالتناظر عبر المحور السيني.
الشكل 9: الأنماط التي تظهر عند تجميع سلاسل زمنية ذات أطوال مختلفة، أنماط السلسلة الزمنية 100 يوم لها منحدر صاعد ملحوظ.
في الشكل 9، أفحص النتائج عند تغيير طول المقطع من 50 يومًا إلى 20 و 100 يومًا، لاحظ أن 20 يوم تداول هي شهر واحد، و 50 يوم تداول هي ربع السنة تقريبًا، و 100 يوم تداول هي نصف عام تقريبًا، يوضح الشكل 9 أنماطًا متشابهة في نافذتي 20 و 50 يومًا، لكننا نرى منحدرًا صاعدًا كبيرًا لقطاع المائة يوم، يشير هذا المنحدر التصاعدي إلى أن الأسهم التي فحصناها، في المتوسط ، زادت في القيمة خلال الفترة التي درسناها (1990-2020) في مقياس نصف عام.
من الممكن أن نحصل على أنماط توافقية لأن طرق التجميع هذه تعتمد على المسافة الإقليدية لفصل الكتل، نظرًا لأن الخطيئة والخطيئة متعاكستان مع بعضهما البعض، وبالتالي فإنهما متباعدتان، ستكون طريقة معقولة جدًا للفصل بين المجموعات، لا نرى نفس الأنماط عندما نستخدم أداة التشفير التلقائي – لأن السلاسل الزمنية قد تم تضمينها في بعد أقل، يتم حساب المسافة في مساحة مختلفة، ومع ذلك، فإن حقيقة أن أنماط التشفير التلقائي تُظهر أيضًا سلوكًا متذبذبًا ومتماثلًا يشير إلى أن هذا ليس مجرد قطعة أثرية من خوارزميات التجميع لدينا، بل بالأحرى ظاهرة قوية.
بعد ذلك، حاولنا التجميع على بيانات متعددة القنوات، قمنا بتضمين أسعار الفتح العالية والمنخفضة والإغلاق هنا، باستخدام طرق K-Means و autoencoder لتجميع البيانات، قمت برسم السلاسل الزمنية المتوسطة أدناه في الشكل 10، لقد وجدت أنه حتى باستخدام البيانات متعددة القنوات، ما زلنا نحصل على نتائج مماثلة – الفئات مفصولة، إلى حد كبير، بعلامة معاكسة التوافقيات.
الشكل 10 أ: السلاسل الزمنية المتوسطة لكل مجموعة باستخدام مجموعات K-Means على بيانات متعددة القنوات (مفتوحة، وعالية، ومنخفضة، وإغلاق)
الشكل 10 ب: السلاسل الزمنية المتوسطة لكل مجموعة باستخدام طريقة التشفير التلقائي على البيانات متعددة القنوات (مفتوحة، عالية، منخفضة، مغلقة)
كانت التجربة النهائية هي تجميع واستخراج الأنماط السائدة من البيانات بعد تصفيتها حسب الربح والخسارة المحتملة، النتائج موضحة في الشكل 11.
● يُظهر خط المثلث الصلب في الشكل 11 مجموعة البيانات القياسية التي تم أخذ عينات منها عشوائيًا والتي استخدمتها من قبل (تم تصنيفها على أنها “غير مفلترة”).
● يُظهر الخط الصلب نتائج التجميع بعد تصفية البيانات لتشمل الأجزاء المربحة فقط – سلاسل زمنية عشوائية بحد أقصى للربح المحتمل بين 10 دولارات و 100 دولار، مع خسارة محتملة لا تزيد عن 10 دولارات.
● يكمل الخط المتقطع المادة الصلبة من خلال إظهار الشرائح المتوسطة بعد التصفية للقطاعات غير المربحة – الأجزاء ذات الخسارة المحتملة بين – 100 دولار و – 10 دولارات، مع ربح محتمل لا يزيد عن 10 دولارات.
الشكل 11: متوسط السلاسل الزمنية لكل مجموعة متسلسلة زمنية مربحة وغير مربحة وغير مصفاة، يتم تجميع كل مجموعة بيانات بشكل منفصل.
ومن المثير للاهتمام، أننا لا نرى أي فرق تقريبًا في مراكز المجموعات بين السلاسل الزمنية الثلاث – غير المفلترة والمربحة وغير المربحة – على الرغم من وجود مثل هذا الاختلاف الكبير في معدل العائد المحتمل بين مجموعات البيانات.
كان الهدف من هذا المشروع هو تحديد الأنماط في بيانات الأسهم باستخدام التعلم الآلي، لقد فعلنا ذلك عن طريق تجميع السلاسل الزمنية ذات الأطوال المختلفة باستخدام طرق مختلفة وتحليل هذه المجموعات.
لاحظنا أنماطًا متذبذبة ومتناظرة عبر أربع طرق تجميع مختلفة، لم تكن هذه الأنماط مؤشرات جيدة للربح أو الخسارة المحتملة.
هناك العديد من الأشياء التي أردت استكشافها ولكن لم أتمكن من استكشافها، بسبب قيود الوقت، على سبيل المثال، استخدام طرق التجميع المختلفة في تضمين وحدة التشفير التلقائي، أو تضمين الحجم كقناة للتجارب متعددة القنوات، قد تكون طريقة بديلة مثيرة للاهتمام للعثور على الأنماط هي استخدام التعلم الخاضع للإشراف مع شبكة عصبية تلافيفية للتنبؤ بالسعر / الربحية المستقبلية وتصور المرشحات التلافيفية، يمكن للمرء أن يكون في الأساس برمجة محلل تقني اصطناعي و (يحتمل) تحديد أنماط الرسوم البيانية الناشئة.
أتمنى أن تكون قد استمتعت بالقراءة عن هذا المشروع وأنه أعطاك نظرة ثاقبة مثيرة للاهتمام حول التعلم الآلي مع التحليل الفني.
لا توجد منتجات في سلة المشتريات.