6 Punkt Zentriert Gleitenden Durchschnitt
David, Ja, MapReduce soll auf einer großen Datenmenge arbeiten. Und die Idee ist, dass im Allgemeinen die Karte und reduzieren Funktionen sollte nicht kümmern, wie viele Mapper oder wie viele Reduzierer gibt es, die nur Optimierung ist. Wenn Sie sorgfältig über den Algorithmus ich gepostet denken, können Sie sehen, dass es doesn39t Angelegenheit, welche Mapper bekommt, welche Teile der Daten. Jeder Eingabesatz ist für jede reduzierte Operation verfügbar, die es benötigt. Ndash Joe K 18. September um 22:30 Im besten Fall meines Verständnisses gleitende Durchschnitt ist nicht schön Karten MapReduce-Paradigma, da seine Berechnung im Wesentlichen Schiebefenster über sortierte Daten ist, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten. Lösung, die ich sehe, ist wie folgt: a) Um benutzerdefinierte Partitionierer zu implementieren, um zwei verschiedene Partitionen in zwei Durchläufen zu machen. In jedem Lauf erhalten Ihre Reduzierer verschiedene Bereiche der Daten und berechnen gleitenden Durchschnitt, wo passend, werde ich versuchen zu illustrieren: Im ersten Lauf Daten für Reduzierer sollte: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Hier werden Sie gleitenden Durchschnitt für einige Qs cacluate. Im nächsten Lauf sollten Ihre Reduzierer Daten wie erhalten: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Und caclulate den Rest der gleitenden Durchschnitte. Dann müssen Sie Ergebnisse zu aggregieren. Idee der benutzerdefinierten Partitionierer, dass es zwei Modi der Operation haben wird - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung. In einem Pseudocode sieht es so aus. Partition (keySHIFT) / (MAXKEY / numOfPartitions) Dabei gilt: SHIFT wird aus der Konfiguration übernommen. MAXKEY-Maximalwert der Taste. Ich nehme zur Vereinfachung an, dass sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split beschränkt ist und kann nicht über Splits Grenze gleiten. Eine weitere Lösung wäre, um benutzerdefinierte Logik der Aufteilung der Eingangsdaten (es ist Teil der InputFormat) zu implementieren. Es kann getan werden, um 2 verschiedene Folien zu tun, ähnlich wie partitioning. When die Berechnung eines laufenden gleitenden Durchschnitt, die Platzierung der Durchschnitt in der mittleren Zeitspanne macht Sinn Im vorherigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume berechnet und platziert es neben Periode 3. Wir konnten den Durchschnitt in der Mitte des Zeitintervalls von drei Perioden platzieren, das heißt, neben Periode 2. Dies funktioniert gut mit ungeraden Zeitperioden, aber nicht so gut für sogar Zeitperioden. Also wo würden wir den ersten gleitenden Durchschnitt platzieren, wenn M 4 Technisch, würde der Moving Average bei t 2,5, 3,5 fallen. Um dieses Problem zu vermeiden wir die MAs glätten M mit 2. So glätten wir die geglätteten Werte Wenn wir eine gerade Anzahl von Begriffen im Durchschnitt, müssen wir die geglätteten Werte Die folgende Tabelle zeigt die Ergebnisse unter Verwendung von M 4.Moving Mittelwerte zu glätten Wenn diese Informationen Gezeichnet auf einem Diagramm, sieht es wie folgt aus: Dies zeigt, dass es eine große Variation in der Anzahl der Besucher je nach Saison. Es gibt weit weniger im Herbst und im Winter als Frühling und Sommer. Wenn wir jedoch einen Trend in der Zahl der Besucher sehen wollten, könnten wir einen 4-Punkt-gleitenden Durchschnitt berechnen. Wir erreichen dies durch die durchschnittliche Besucherzahl in den vier Quartalen 2005: Dann finden wir die durchschnittliche Besucherzahl in den letzten drei Quartalen 2005 und im ersten Quartal 2006: Dann die letzten beiden Quartale 2005 und die ersten beiden Quartale Von 2006: Das letzte Mittel, das wir finden können, ist für die letzten zwei Quartale von 2006 und die ersten zwei Quartale von 2007. Wir zeichnen die gleitenden Durchschnitte auf einem Diagramm und stellen sicher, dass jeder Durchschnitt in der Mitte der vier Viertel geplottet wird Es deckt sich: Wir können jetzt sehen, dass es eine sehr leichte Abwärtstrend bei den Besuchern.4 Punkt gleitende Durchschnitte und zentrierte gleitende Durchschnitte Mein Gehirn ist wirklich fehlschlägt mich heute - oh lieber. 001unsure: Ich mache ein Unit 7 Simulation Praxis Papier und es ist eine Frage, fragen mich, die Umsatzentwicklung in den letzten 3 Jahren mit bewegten Durchschn. Ich bin 3 Jahre im Wert von Verkaufszahlen gegeben, die jeweils in die 4 Quartalen aufgeteilt. Meine Studie Buch nur Details 3 Punkt gleitende Durchschnitte, aber zum Glück habe ich bereits studiert 4 Punkt gleitende Durchschnitte auf Tech-Ebene - Ich möchte nur zu klären, dass das, was ich tue, richtig ist. Die Schablone, die ich bekomme, zeigt die Verkaufszahlen in einer Spalte, dann eine Spalte für den 4-Perioden-gleitenden Durchschnitt und eine letzte Spalte für den zentrierten gleitenden Durchschnitt. Also, was ich tue, ist die Gesamtsumme von Jahr 1 (alle 4 Quartale) und dividiert durch 4 - dieser Durchschnitt geht zwischen yr 1 Q2 und Q3, dann fahre ich fort, diese Berechnung aber nach unten verschieben diese Spalte dh die nächste Berechnung ist Jahr 1 Q1, Q2 und Q3 plus yr 2 Q1, dividiert durch 4, und dies zwischen yr 1 Q3 und Q4 usw. Dann gehen in die zentrierte gleitende mittlere Spalte die 2 Mittelwerte und dividieren durch 2 und setzen die Figur gegen yr 1 Q3 und Tragen Sie die Spalte so weiter. Ist dies richtig klingenMethode der gleitenden Mittelwerte Kommentare sind aus Angenommen, es gibt Zeiten, die durch und die entsprechenden Werte der Variablen sind. Zunächst müssen wir die Periode der gleitenden Durchschnitte bestimmen. Für kurze Zeitreihen verwenden wir 3 oder 4 Werte. Für lange Zeitreihen kann der Zeitraum 7, 10 oder mehr betragen. Für vierteljährliche Zeitreihen berechnen wir immer Mittelwerte, die 4-Viertel zu einer Zeit nehmen. In monatlichen Zeitreihen werden 12-monatige gleitende Durchschnittswerte berechnet. Angenommen, die vorgegebene Zeitreihe ist in Jahren und wir haben beschlossen, den 3-jährigen gleitenden Durchschnitt zu berechnen. Die durchgeführten gleitenden Mittelwerte werden wie folgt berechnet:
Comments
Post a Comment