Bli medlem i Norsk elbilforening og støtt driften av Elbilforum. Som medlem får du i tillegg startpakke, medlemsfordeler og gode tips om elbil og lading. Du blir med i et fellesskap som jobber for mindre utslipp fra veitrafikken. Medlemskap koster 485 kroner per år. elbil.no/medlemskap
Hovedmeny

Sv: Tesla i norske medier

Startet av lunitiks, fredag 09. desember 2016, klokken 23:49

« forrige - neste »

knut.aulie

Sitat fra: lunitiks på onsdag 04. januar 2017, klokken 22:44

Ingen sensortype er dårligere eller bedre enn de andre per se: Hver sensorvariant har sine styrker og sine svakheter.

LIDAR

RADAR

KAMERA

SONAR
Forkortet et veldig bra innlegg[emoji1]

Hadde det ikke vært best å ha alle varianter for å kunne utnytte fordelene og oppveie svakhetene?

petersv

Selvfølgelig, men kost er en faktor i bildet også. Hvis tesla klarer å finne en måte å holde kameraene frie for skit og får lagt til stereosyn, så tror jeg det holder i massevis.

eha

#572
Sitat fra: petersv på søndag 08. januar 2017, klokken 08:30
Selvfølgelig, men kost er en faktor i bildet også. Hvis tesla klarer å finne en måte å holde kameraene frie for skit og får lagt til stereosyn, så tror jeg det holder i massevis.

Det er ikke nødvendig med statisk stereosyn etter min mening, og jeg skal forsøke å forklare hvorfor jeg mener akkurat det. (I det følgende kan jeg kanskje virke litt belærende for noen. Det er absolutt ikke meningen. Jeg vet at mange av dere kjenner godt til disse prinsippene allerede, men jeg tar det grundig slik at absolutt alle kan henge med.)

En av de mest etablerte metodene for å regne ut avstanden til et objekt er triangulering (fra trigonometrien), som bygger på grunnformen triangel, eller trekant. En trekant har tre sider - la oss kalle lengdene av disse a, b og c - og tre vinkler - disse kan vi kalle A, B og C (i antall grader).

Vi vet at summen av vinklene i en trekant er 180 grader. Vi vet også at dersom vi kjenner til verdien av minst 3 av de over, kan vi finne de resterende. For eksempel: Hvis vi kjenner A, B og c, altså to vinkler og én lengde, så kan vi regne ut verdien av de resterende to lengdene og den ene vinkelen. (Unntaket er hvis vi bare kjenner alle de tre vinklene; da trenger vi i tillegg minst én lengde for å vite hvor stor trekanten er.)

Så til sakens kjerne:

Et statisk stereooppsett med to kameraer kan enkelt regne ut avstanden til et objekt. Se figuren under. Kameraene markert i grønt ser rett frem. Kameraenes synsfelt i antall grader er kjent, så ut fra plasseringen av objektet i antall grader på bildesensoren er det lett å finne vinkel A og vinkel B. Avstanden mellom kameraene, c, er også kjent. Å finne avstanden x til objektet er dermed trivielt.



Men vi klarer oss med ett kamera, og det kan gjøres på minst to forskjellige måter:

  • Statisk - uten bruk av tidsaspekt
  • Dynamisk - med bruk av tidsaspekt
Se igjen på figuren over. Forestill deg at vi fjerner kamera 2. Vi har nå bare ett kamera - kameraet.

Statisk: Kan vi fremdeles finne x? Vi trenger minst to vinkler og én side, eller omvendt. Nå er x en av sidene; den har vi ikke. Vi har heller ikke siden a. Men vi kjenner vel avstanden mellom kameraets plassering og midten av bilen? Jo, denne er c/2. Så da må vi finne to vinkler. Vi kjenner vinkelen mellom c og x. Den må være 90 grader. Den siste vinkelen, A, kjenner vi på samme måte som i det første eksempelet over. Fordi kameraet ser rett frem og ikke er vinklet mot objektet, vet vi vinkelen. Ergo er det trivielt å finne x!

Merk at kameraet på bilen har en kritisk egenskap: Dets plassering på bilen og vinkling er kjent. Dette ville aldri ha fungert med et løst mobilkamera man holdt i hånden, for eksempel.

Dynamisk: Her innfører vi aspektet tid og utnytter det faktum at bilen beveger seg. Bilen vet hvilken fart den har, og da kan den vite hvor langt den har kjørt i et gitt tidsrom. For enkelhets skyld, la oss si at dette tidsrommet er 1 sekund (sannsynligvis kan det være mye kortere). Kameraet gjør da altså en observasjon ved en gitt tid t=0, og en ny observasjon ved t=1. Disse vil være ulike fordi bilen har beveget seg. Distansen som bilen, og altså kameraet, har beveget seg kan vi kalle c. Vi ser nå at det danner seg et triangel med c som en av sidene. Vinklene A og B finnes på samme måte som over. Ergo kan vi lett finne gjennomsnittet av x over tidsrommet.

Denne dynamiske tilnærmingen fungerer åpenbart best når vi får et triangel uten svært spisse vinkler. Kjører vi rett frem mot et objekt blir vinklene 0, 0 og 180 grader, og det blir da umulig å bruke denne metoden. Derfor vil den fungere bedre for sidekameraene. Dette er også en slags form for "emulert stereosyn", så ja, Tesla kan på denne måten få "lagt til stereosyn" :)

Jeg har nå vist to ulike metoder for å beregne avstander med ett kamera, og de utnytter to ulike egenskaper som er spesielt med kamera på bil: For det første at kameraets plassering på bilen samt vinkling og synsfelt er kjent, og for det andre at bilens fart er kjent. Disse to ulike metodene vil kunne kombineres og brukes samtidig, mange ganger hvert sekund, for å regne ut avstander med ganske stor nøyaktighet.

Det er åpenbart vanskeligst å regne ut avstander mot et objekt i samme retning som bilen beveger seg (rett frem), og derfor er det også betryggende å se at Tesla utstyrer bilene med tre kameraer og én radar som ser fremover. Langs sidene er det åpenbart at avstand lett kan beregnes ut fra den dynamiske tilnærmingen over, så her holder det i massevis at ett kamera dekker.

Bakover er man dekket av tre kameraer på lang avstand - og det er ved lange avstander at redundans er kritisk, som vist over. Når et objekt kommer nærme vil man etter hvert være dekket av ryggekameraet samt ultrasoniske sensorer.
2017 Tesla Model X 90D
201X Tesla Model 3 reservert

lunitiks

2015 Tesla Model S 70D
2014 Nissan Leaf 6,6 kW

Øggen

Bra reklame for Tesla. Uansett e det Volvo og siste ut,  Audi det snakkast mest om i samarbeid med Nvidia i media desverre.
P85, pearl white,  Solgt
S85D Mid.grå, Grå Next gen, Alle ekstra...Avgått med døden
S85D  Titanium, Grå Next gen foran og bak, matt obeche,+++  Solgt
X75D Med alt......
CyberTruck TriMotor/FSD

RuneW

Hmm... Er litt skeptisk til den statiske metoden din. Hvordan vet du forskjell på avstanden til alle mulige ting som ligger på linjen mellom A og C (og ikke minst, forbi C)?

Vel, vel, uansett...

Vi mennesker er relativt råe på å bedømme avstander, selv med ett øye, men det går mer på erfaring (form, farge, størrelse). "Oj noe som ligner en søplepose. Den er normalt så og så stor. Siden den dekker så mye av synsfeltet er den så og så langt unna.". Tror et nevralt nettverk kan gjøre mye av det samme på sikt.

Her er forresten en annen dynamisk måte et enkeltkamera kan måle avstand, men som med alle andre måter så blir det unøyaktig på litt avstand og antageligvis helt teoretisk. Jeg tenker da på man kan bruke fokus. Om et kamera har en fokus satt på, si 100m, så kan man (i teorien) detektere at objekter blir klarere og så mer uklare idet de kommer nærmere. Forskjellen i klarhet kan (i teorien) brukes til å beregne avstand til et objekt. Men dette blir nok noe sært... Kanskje det kan brukes i kombinasjon med det andre for enda bedre nøyaktighet. Det er det som er så morsomt med opplæringen av dette systemet. Kanskje det allerede bruker disse tingene for alt vi vet (eller noensinne kommer til å vite...).
TM3 LR AWD
TMY LR AWD (bestilt)

eha

Jeg tenkte også på fokus-metoden du nevner, faktisk, men i praksis tror jeg at det vil være litt vanskelig å implementere. Enda en mulighet er avansert fasedeteksjon (som speilreflekskameraer bruker for å fokusere). Objektivet på et speilreflekskamera har ofte et vindu hvor du kan se avstanden som et resultat av akkurat det du sier. Objektivets egenskaper er kjent, dvs. hvordan det fokuserer og i hvilken tilstand det vil være når det finner fokus på en gitt avstand, og vi kan dermed vite avstanden.

Jeg er også helt enig i det du sier om nevrale nettverk, og dette har jeg også forsøkt å belyse tidligere i denne tråden.

Poenget mitt er egentlig bare at det ikke er nødvendig med stereokameraer for å kunne anslå avstand med stor nøyaktighet, og du og jeg nevner bare noen ulike fremgangsmåter "off the top of our heads". Utviklerne har sikkert enda flere metoder som vi ikke har tenkt på.

Jeg tror ikke jeg helt skjønte hva du mente var galt med den statiske metoden jeg foreslo. Du trenger ikke vite lengden av a for å finne x, du trenger bare vite én lengde, nemlig mellom kameraet og midten av bilen, samt to vinkler. Vinkelen mellom fronten og x er 90 grader. Vinkelen A finner du ved at du utnytter kunnskapen om synsfeltet til kameraet. Et objekt som registreres på bildesensoren vil ha en forskyvning i forhold til midten.

La oss si at kameraet dekker nøyaktig 90 grader, for å gjøre det enkelt. Kameraet vil da se 45 grader til hver side for midten (rett frem). Hvis objektet er ca. 3/4 til høyre i bildet, altså mellom midten og kanten av bildet, vil objektet være 22,5 grader fra midten. Vinkel A blir dermed 67,5 grader.
2017 Tesla Model X 90D
201X Tesla Model 3 reservert

RuneW

Sitat fra: eha på mandag 09. januar 2017, klokken 16:15
Jeg tror ikke jeg helt skjønte hva du mente var galt med den statiske metoden jeg foreslo. Du trenger ikke vite lengden av a for å finne x, du trenger bare vite én lengde, nemlig mellom kameraet og midten av bilen, samt to vinkler. Vinkelen mellom fronten og x er 90 grader. Vinkelen A finner du ved at du utnytter kunnskapen om synsfeltet til kameraet. Et objekt som registreres på bildesensoren vil ha en forskyvning i forhold til midten.

La oss si at kameraet dekker nøyaktig 90 grader, for å gjøre det enkelt. Kameraet vil da se 45 grader til hver side for midten (rett frem). Hvis objektet er ca. 3/4 til høyre i bildet, altså mellom midten og kanten av bildet, vil objektet være 22,5 grader fra midten. Vinkel A blir dermed 67,5 grader.

Problemet med den statiske metoden er at du, så vidt jeg kan forstå, går ut fra at alle objekter du måler avstanden til ligger langs X.

Det er greit nok at alle objekter man umiddelbart skal passe seg for er de som ligger langs X, men det er ikke det samme som at alle objekter kameraet fanger opp ligger der. Se bilde under.


Men om nettverket med relativ stor sikkerhet klarer å plassere objektene i sideveis retning (og det vil det muligens etterhvert), så kan sikkert denne metoden være et nyttig tilskudd til de andre metodene.
TM3 LR AWD
TMY LR AWD (bestilt)

eha

Ah, ja, selvsagt. Visste jeg hadde oversett noe :) Du har selvfølgelig rett.
2017 Tesla Model X 90D
201X Tesla Model 3 reservert

N00b

Er landmåler og den statiske målingen er et falsum. Det går ikke å beregne avstanden slik.
Da hadde vi ikke trengt avstandsmålere i kikkerten.

petersv

Å legge til flere kamera er jo veldig enkelt og rimelig ift. alternativene. Er spent på hva de kommer opp med for å holde sikten i vær og vind. Det er det vel ikke noe revolusjonerende som har skjedd se siste 100 årene. Løser de ikke dette vil de etter min mening ikke klare å nå full autonomitet.

eha

Sitat fra: N00b på onsdag 11. januar 2017, klokken 05:39
Er landmåler og den statiske målingen er et falsum. Det går ikke å beregne avstanden slik.
Da hadde vi ikke trengt avstandsmålere i kikkerten.

Det er jo bare fordi man ikke vet at bilen og x er på en gitt linje som danner rett vinkel med planet mellom bilens midt og kameraet. Dersom det hadde vært tilfellet hadde det selvfølgelig gått an. Kanskje ikke med de måleinstrumenter som landmålere benytter, for det vet jeg ingenting om, men jeg snakker om å detektere vinkel på kameraets sensorflate ut fra kameraets kjente, optiske egenskaper.

Jeg tror bare vi snakker forbi hverandre her, det er ingenting galt med trigonometrien... :)
2017 Tesla Model X 90D
201X Tesla Model 3 reservert

lunitiks

@elonmusk 16.40 - 10. jan. 2017:
Sitat
Tesla's approach to building an autonomy platform is focused on high compute efficiency machine learning. Primarily vision w radar & sonar.
2015 Tesla Model S 70D
2014 Nissan Leaf 6,6 kW

RuneW

#583
Sitat fra: eha på onsdag 11. januar 2017, klokken 12:35
Sitat fra: N00b på onsdag 11. januar 2017, klokken 05:39
Er landmåler og den statiske målingen er et falsum. Det går ikke å beregne avstanden slik.
Da hadde vi ikke trengt avstandsmålere i kikkerten.

Det er jo bare fordi man ikke vet at bilen og x er på en gitt linje som danner rett vinkel med planet mellom bilens midt og kameraet. Dersom det hadde vært tilfellet hadde det selvfølgelig gått an. Kanskje ikke med de måleinstrumenter som landmålere benytter, for det vet jeg ingenting om, men jeg snakker om å detektere vinkel på kameraets sensorflate ut fra kameraets kjente, optiske egenskaper.

Jeg tror bare vi snakker forbi hverandre her, det er ingenting galt med trigonometrien... :)

Jeg drister meg til å gjette på at antallet pixler et gitt objekt dekker + erfaring om ha slags objekt det er snakk om vil være den mest effektive måten å måle "statisk" på. Bare tenk på oss selv, hvor raske vi er til å identifisere objekter på et blunk. Vi må bare anta at med ML så vil dette raskt bli bedre enn oss.

Og vet man hvor stort et objekt er, kan man anslå avstanden.

Det er selvsagt scenarier hvor dette klapper sammen, f.eks. hvor man bare kan se to baklys, men da er det bra at man har litt flere bein (sensorer) å stå på...

Og nok en gang: Det fine (skumle) med ML er at maskinen kan finne ut av disse tingene selv. Alle disse metodene vi diskuterer fram og tilbake. Vi kan antageligvis lene oss tilbake (hehe, i alle fall oss kunder) og la systemet finne ut av det  :)
TM3 LR AWD
TMY LR AWD (bestilt)

ChrML

Det store spørsmålet når det kommer til maskinlæring er forutsigbarhet. Normalt kan man gå til en utvikler og spørre hva skjer hvis spørsmål som stort sett kan svares ut enkelt, fordi man har forhåndsprogrammert det.

Nå er det istedet en stor base av erfaringer avgjørelsene er basert på. En bra ting mtp at det er umulig å programmere flere millioner scenarioer, men håper de har gode måter å kvalitetssikre/kjøre igjennom hva maskinene har lært før de kjører ut nye revisjoner. Ellers vil vi se "mye rart" fremover som er vanskelig å forklare og finne årsaken til.

© 2024, Norsk elbilforening   |   Personvern, vilkår og informasjonskapsler (cookies)   |   Organisasjonsnummer: 982 352 428 MVA